本 书 第 1 版 在 2008 年 初出 版 以 后 ， 受 到 广大 读者 
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的 市 场 和 读者 反馈 看 ， 在 第 1 版 中 还 存在 一 些 不 足 ， 主 要 是 以 下 几 方 面 。 
e 没有 现成 的 开发 环境 ， 读 者 需要 从 头 到 尾 构建 ， 而 构建 需要 花费 很 长 的 时 间 ， 许 多 时 候 
会 不 成 功 ， 加 之 配套 光盘 中 的 实例 没有 Makefile， 更 加 大 了 操作 的 难度 。 
e 没有 配套 的 开发 板 , 大 量 的 基于 S3C2410 的 实例 读者 身边 如 果 没 有 可 以 直接 运行 的 平台 ， 
就 无 法 亲身 体验 这 些 驱 动 。 


e 个别 内 容 实 用 性 不 强 或 过 于 陈旧 ， 也 有 个 别 知识 点 的 i 
platform 驱动 。 
e 一些 知识 点 内 容 不 够 完整 ,如 input 驱动 、USB UDC 和 gadget 驱动 、SPI 驱动 、ASoC 驱动 


鉴于 此 ， 作 者 针对 以 上 问题 对 第 1 版 内 容 进 行 















































的 内 容 进 行 了 修订 。 
一 些 是 对 重点 内 容 的 增强 ， 
整 的 全 方位 、 立 体式 Linux 设备 双 

(1) 直接 提供 VirtualBox 虚拟 机 ， 该 虚拟 机 上 已 























这 些 修订 ， 一 些 是 对 过 时 内 容 的 
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(20 提供 


6410)， 使 得 书 ， 


再 需要 安装 环境 即 


了 专门 的 配套 学 习 板 一 一 
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(3) 全 再 














X, W PC 驱动 


了 介绍 。 


(4) 删除 了 过 时 的 内 容 ， 如 传统 的 按键 引 


驱动 、ALSA SoC Jj 
iX. Linux PEREI 
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Linux 设备 马 


些 则 是 有 


ub SO, qe 


种 真实 设备 驱动 实例 
升级 内 核 至 Linux 2.6.28.6， 根 据 Linux 
的 体系 结构 、 网 络 NAPI 的 
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RZJ, input 驱动 、SPI 驱动 、 基 于 


知识 点 的 ] 
区 动 学 习 平 台 。 第 2 版 相对 第 1 


有 了 实验 的 


接口 等 ， 
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多 订 ， 推 出 了 第 2 版 。 





o m 
so 


新 版 中 对 全 书 超过 4 
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依托 。 


包含 了 书 ， 
细 介 绍 了 各 个 实验 的 步骤 。 
基于 三 星 S3C6410 SoC 的 LDD6410 (Linux Device Drivers 


些 是 对 讲解 不 清 的 知识 点 的 修正 ， 
目的 是 为 读者 提供 一 套 更 加 准 
版 的 主要 改动 如 下 。 
所 需 的 开发 环境 和 源 代码 ， 读 者 








































































































区 动 、SAA7113H 启动 、 传 统 的 IDE 驱动 等 ， 同 时 新 
增 了 大 量 内 容 , 包括 Linux 内 核 的 编码 风格 、Linux 内 核 的 移植 、Android 驱动 .USB UDC 和 gadget 
sysfs 的 设备 驱动 、Linux 设备 驱动 的 固件 加 





























设备 驱动 分 离 
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\ 想 等 。 





类 似 于 globalmem 和 globalfifo 驱动 。 
(6) 对 许多 关键 知识 点 的 讲解 进行 了 语言 
以 专门 章节 讲解 platform 驱动 等 。 
全 书 总 体 结构 仍然 与 第 1 版 一 致 ， 共 分 4 篇 23 章 ， 内 容 安排 如 下 。 
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第 1 章 主 





Sir 








区 动 的 





ME as 
源 管理 、 








区 动 方面 , 删除 了 RAMDISK J 

















第 1 一 3 章 ) 主要 讲解 Linux 设备 驱动 的 基础 。 











解 设备 驱动 的 作用 ， 














调整 和 内 容 增强 ， 以 便 读 者 能 更 好 地 理解 ， 





内 核 API 的 变更 情况 更 
对 delayed work 等 较 新 的 内 核 机 种 











新 了 书 中 的 所 有 内 
进行 
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Linux 驱动 的 分 层 设计 思想 、 主 机 驱动 与 























区 动 实例 ,而 新 增 了 更 加 简单 易 懂 的 vmem disk. 
































例如 ， 


























从 无 操作 系统 的 设备 驱动 引出 了 Linux 操作 系统 下 的 设 
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Linux 设备 驱动 开发 详解 (第 2 版 ) 











备 驱动 以 及 全 书 所 | 


























动 开发 的 硬件 基础 。 本 章 涵盖 了 各 利 











方法 和 仪器 使 用 方法 。 












































编程 方法 ， 为 纺 


第 3 章 将 Linux 设备 
写 Linux 设备 纪 
第 2 篇 (第 4~12 章 ) 主要 讲解 Linux 设备 驱动 编程 的 基础 理 











实验 环境 的 安装 方法 。 
第 2 章 系统 地 讲解 了 一 个 Linux 驱动 工 




















区 动 放 在 Linux 2.6 内 核 背 景 ! 
区 动 打 下 软件 


























进行 











AS 





基础 。 





程 师 应 该 掌握 的 硬件 知识 ， 使 读者 打下 Linux 设备 驱 
类 型 的 CPU、 存储 器 和 常见 的 外 设 ， 



















































































设计 中 涉及 的 并 发 控制 、 同 步 等 问题 以 及 Linux 驱动 的 工程 化 。 














第 4、5 章 分 别 























fif. Linux 内 核 模块 和 Linux 设备 文件 系统 。 
第 6 一 9 章 以 虚拟 设备 globalmem 和 globalfifo 为 主线 i 
解 了 并 发 控制 、 阻 塞 与 非 阻 塞 、 异 步 IO 等 高 级 控制 功能 。 



































第 10、11 章 分 
globalmem 和 globalfifo 驱动 与 真实 
































别 讲解 Linux 驱动 编程 中 所 涉及 的 中 断 和 定时 器 ， 
项 目 中 看 到 的 驱动 有 





























设备 驱动 的 工程 化 问题 ， 让 读者 了 解 真 实 的 驱动 要 考虑 的 诸多 问题 。 





第 3 篇 (第 13—21 章 ) 深刻 剖析 复杂 设备 驱动 的 
及 的 设备 包括 块 设备 、 终 端 设备 、FC 适配器 与 TC 设备 、 网 络 设备 、PCI 设备 、USB EHS 
USB 设备 、UDC、 
的 形式 给 出 各 种 设备 驱动 的 设计 框架 ， 然 后 用 
第 4 篇 (第 22~23 EO 详细 i 


























第 22 章 讲解 


进行 驱动 调试 的 方法 ， 最 后 介绍 了 





























gadget. LCD 设备 、 





Flash 设备 等 。 





些 不 同 ， 第 





























WIZA O 操作 处 理 方法 。 
12 章 详 细 讲 解 Linux 














篇 的 i 





解 







































































第 23 Ei 








动 等 现成 代码 进行 Linux 驱动 快速 移植 的 方法 ， 最 后 介绍 了 如 何在 一 块 


Linux. 


本 书 的 结构 及 内 容 参 见 附 图 。 
最 后 ， 再 次 对 广大 读者 以 及 所 有 为 本 书 提出 过 宝贵 意见 、 
意 ! 读者 朋友 可 继续 通过 本 书 专 





Sca EIU 


进行 交流 。 


本 书 服务 QQ: 


ETH 

















解 了 Linux 设备 驱动 和 内 核 
了 Linux 设备 驱动 的 开发 环境 构建 以 及 
Linux 的 性 能 调 优 工具 。 
F 发 可 移植 驱动 程序 以 及 借助 芯片 范例 程序 、demo 板 驱 动 和 其 他 操作 系统 双 











































































































1275822672 


服务 E-mail: book(gLinuxdriver.cn 


ie WT UL A 





咨询 索取 相关 资料 








象 与 具体 相 结合 ， 


【 体 实 例 设备 的 驱动 填充 对 应 的 模板 。 
的 调试 和 移植 方法 。 
借助 printk、oops、/proc、strace、 仿 真 器 
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宋 宝 华 


SA 


新 的 SoC 和 电路 板 上 构建 


讲解 了 硬件 时 序 分 析 

解 ， 说 明 Linux 内 核 的 基本 原理 和 
论 、 字 符 设 备 驱 动 、 设 备 驱 动 

解 了 字符 设备 驱动 的 编写 方法 ， 并 讲 








体系 架构 ， 每 一 章 都 给 出 了 具体 的 实例 ， 涉 
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先 以 模板 
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FE 奉献 过 力量 的 人 们 表 
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Linux 设备 驱动 的 调试 (第 22 章 ) 


内 核 调试 方法 (printk、 
/proc、 Oops» strace 


kgdb、 仿 真 器 ) 


开发 环境 Linux 性 能 
构建 GDB 分 析 与 优化 


调试 与 移植 


Linux TC 核心 、 


Linux 块 设 备 驱 动 Linux 终端 设备 
(第 13 章 ) 驱动 〈 第 14 章 ) 


总 线 与 设备 驱动 
(第 15 章 ) 

F Linux Flash Linux USB 主机 控制 

Linux LCD 设备 驱动 设备 驱动 器 、 设 备 驱动 与 
(第 18 章 ) (第 18 章 ) gadge 驱动 (第 20 章 ) 
复杂 设备 驱动 

Linux ER | [UAE | Linux 字符 设备 驱动 

(第 4 章 ) (第 5 章 ) (第 6 章 ) 


Linux 设备 驱动 中 的 yi 
i 中 断 与 时 钟 内 存 与 VO 访问 


字符 设备 驱动 与 驱动 开发 


设备 驱动 开发 的 硬件 基础 (第 2 RD) 


驱动 概述 
CB 130 


处 理 器 、 存 储 器 \| 原理 图 、 硬 件 时 序 、| 仪 器 仪表 
接口 与 总 线 芯片 手册 分 析 使 用 


驱动 开发 基础 


Linux 设备 驱动 的 移植 (第 23 章 ) 





2.4/2.6 i 与 其 
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Linux 音频 设备 驱动 
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OSS/ALSA/ASoC 
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Linux 设备 驱动 中 的 | | Linux 设备 驱动 中 的 
开发 控制 阻塞 与 非 阻塞 IO 
(第 7 章 ) (第 8 章 ) 


Linux 设备 驱动 的 工程 化 (第 12 章 ) 
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Linux 内 核 及 内 核 开发 基础 (第 3 38) 
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本 章 导读 
本 章 将 介绍 Linux 设备 驱动 开发 的 基本 概念 ， 并 对 本 书 所 基于 的 平台 











和 开发 环境 进行 讲解 。 


1.1 755 8] 





1.2 节 和 


备 驱 动 的 设计 ， 通 过 对 两 者 不 同 的 分 析 





` 
关系 。 


1.4 节 对 Linux 操作 系统 的 设备 


备 驱动 与 整个 软 硬 件 系统 的 关系 ， 分 析 了 Linux wA 





学 习 方 法 。 


1.5 节 对 本 书 


行 了 介绍 。 
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解 在 无 操作 系统 情况 下 和 有 操作 系统 情况 下 设 

















解 设备 驱动 与 硬件 和 操作 系统 的 





区 动 进行 了 概要 性 的 介 2 
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0 开发 环境 的 安装 进 





LED 驱动 在 无 操作 系统 情况 下 和 Linux 操作 系统 下 的 实现 。 


























区 动 的 “Hello World” 实 例 ， 即 最 简单 的 
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设备 驱动 的 作用 


任何 一 个 计算 机 系统 的 运转 都 是 系统 中 软 硬 件 共同 努力 的 结果 ， 没 有 硬件 的 软件 是 空中 楼 阁 ， 
而 没有 软件 的 硬件 则 只 是 一 堆 废 铁 。 硬 件 是 底层 基础 ， 是 所 有 软件 得 以 运行 的 平台 ， 代 码 最 终 会 
落实 为 硬件 上 的 组 合 逻 辑 与 时 序 逻 辑 。 软 件 则 实现 了 具体 应 用 ， 它 按照 各 种 不 同 的 业务 需求 而 设 
计 ， 完 成 了 用 户 的 最 终 诉求 。 硬 件 较 固定 ， 软 件 则 很 灵活 ， 可 以 适应 各 种 复杂 多 变 的 应 用 。 可 以 
说 ， 计 算 机 系统 的 软 硬 件 互相 成 就 了 对 方 。 
但 是 ， 软 硬件 之 间 同 样 存在 着 悖 论 ， 那 就 是 软件 和 硬件 不 应 该 互相 渗透 入 对 方 的 领地 。 为 尽 
可 能 快速 地 完成 设计 ， 应 用 软件 工程 师 不 想 也 不 必 关 心 硬件 ， 而 硬件 工程 师 也 难 有 足够 的 闲暇 和 
能 力 来 顾及 软件 。 壁 如 ， 应 用 软件 工程 师 在 调用 套 接 字 发 送 和 接收 数据 包 的 时 候 ， 不 必 关 心 网 卡 
上 的 中 断 、 寄 存 器 、 存 储 空 间 、LIO 端口 、 片 选 以 及 其 他 任何 硬件 词汇 ， 在 使 用 printtO 函 数 输出 
言 息 的 时 候 ， 他 不 用 知道 底层 究竟 是 怎样 把 相应 的 信息 输出 到 屏幕 或 者 串口 。 
也 就 是 说 ， 应 用 软件 工程 师 需要 看 到 一 个 没有 硬件 的 纯粹 的 软件 世界 ， 硬 件 必 须 被 透明 地 呈现 给 
他 。 谁 来 实现 硬件 对 应 用 软件 工程 师 的 隐形 ? 这 个 光荣 而 艰巨 的 任务 就 落 在 了 驱动 工程 师 的 头 上 。 
对 设备 驱动 最 通俗 的 解释 就 是 “驱使 硬件 设备 行动 >， 驱动 与 底层 硬件 直接 打交道 ， 按 照 硬件 
设备 的 具体 工作 方式 ， 读 写 设备 的 寄存 器 ， 完 成 设备 的 轮 询 、 中 断 处 理 、DMA 通信 ， 进 行 物 理 
内 存 向 虚拟 内 存 的 映射 等 ， 最 终 让 通信 设备 能 收发 数据 ， 让 显示 设备 能 显示 文字 和 画面 ， 让 存储 
设备 能 记录 文件 和 数据 。 
此 可 见 ， 设 备 驱动 充当 了 硬件 和 应 用 软件 之 间 的 纽带 ， 它 使 得 应 用 软件 只 需要 调用 系统 软 
件 的 应 用 编程 接口 CAPI 就 可 让 硬件 去 完成 要 求 的 工作 。 在 系统 中 没有 操作 系统 的 情况 下 ， 工 
程 师 可 以 根据 硬件 设备 的 特点 自行 定义 接口 ， 如 对 串口 定义 SerialSend0、SerialRecvO0， 对 LED 
定义 LightOn(). LightOff(), X} Flash 定义 FlashWrite0、FlashRead0 等 。 而 在 有 操作 系统 的 情况 下 ， 
驱动 的 架构 则 由 相应 的 操作 系统 定义 ， 驱 动工 程 师 必须 按照 相应 的 架构 设计 驱动 ， 这 样 ， 驱 动 才 
能 良好 地 整合 入 操作 系统 的 内 核 。 
驱动 程序 沟通 着 硬件 和 应 用 软件 ， 而 驱动 工程 师 则 沟通 着 硬件 工程 师 和 应 用 软件 工程 师 。 目 
前 ， 随 着 通信 、 电 子 行业 的 迅速 发 展 ， 全 世界 每 天 都 会 有 大 量 的 新 芯片 被 生产 ， 大 量 的 新 电路 板 
被 设计 ， 也 因此 ， 会 有 大 量 设备 驱动 需要 开发 。 这 些 驱动 ， 或 运行 在 简单 的 单 任务 环境 ， 或 运行 
在 VxWorks, Linux, Windows 等 多 任务 操作 系统 环境 ， 发 挥 着 不 可 替代 的 作用 。 


无 操作 系统 时 的 设备 驱动 


并 不 是 任何 一 个 计算 机 系统 都 一 定 要 运行 操作 系统 ， 在 许多 情况 下 ， 操 作 系 统 都 不 必 存 在 。 
对 于 功能 比较 单一 、 控 制 并 不 复杂 的 系统 ， 壁 如 ASIC 内 部 、 公 交 车 的 刷卡 机 、 电 冰箱 、 微 波 炉 、 
简单 的 手机 和 人 小 灵通 等 ， 并 不 需要 多 任务 调度 、 文 件 系 统 、 内 存 管理 等 复杂 功能 ， 用 单 任务 架构 
完全 可 以 良好 地 支持 它们 的 工作 。 一 个 无 限 循环 中 夹杂 对 设备 中 断 的 检测 或 者 对 设备 的 轮 询 是 这 
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种 系统 中 软件 的 典型 架构 ， 如 代码 清单 1.1。 
代码 清单 1.1 单 任务 软件 典型 架构 
t ine Ma coe ene 
2E 
2 while (1) 
4 { 
5 if (serialInt == 1) 
6 / VR E EL FREE / 
7 ( 
8 ProcessSerialInt(); /*AbPHEBLIrgWr*/ 
9 serialInt = 0; /# 中 断 标 志 变 量 清 0*/ 
0 
于 if (keyInt == 1) 
2 /* 有 按键 中 断 */ 
3 
4 ProcessKeyInt(); /* 处 理 按 键 中 断 */ 
5 keyInt = 0; /* 中 断 标志 变 量 清 0*/ 
6 
di Status = CheckXXX(); 
8 Switch (status) 
9 
20 
21 
22 
29 3 
2 
在 这 样 的 系统 中 ， 昌 然 不 存在 操作 系统 ， 但 是 设备 驱动 则 无 论 如 何 都 必须 存在 。 一 般 情况 下 ， 
每 一 种 设备 驱动 都 会 定义 为 一 个 软件 模块 ， 包 含 .h 文件 和 .c 文件 ， 前 者 定义 该 设备 驱动 的 数据 结构 
并 声明 外 部 函数 ， 后 者 进行 驱动 的 具体 实现 。 壁 如 ， 可 以 如 代码 清单 1.2 那样 定义 一 个 串口 的 驱动 。 







































































代码 清单 1.2 无 操作 系统 情况 下 串口 的 驱动 
Jf rts SEE E uat EE torus 


*serial.h 文件 
do RE REGE EE e OR GRE S auus i 


extern void SerialInit (void); 
extern void SerialSend(const char buf*,int count); 
extern void SerialRecv(char buf*,int count); 


Ah hha oko Ioco ook 


*serial.c 文件 
iaa ahan EE t EE e a ott Ra fr 


/* 初 始 化 串口 */ 


void SerialInit (void) 


AO CO» oJ GNS = a VAR $ a os 4c o [3 











ur 











/*"h 











发 送 */ 


void SerialSend(const char buf*,int count) 
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接收 */ 


























22 void SerialRecv(char bof*,int coünt) 





26 /# 串 口中 断 处 理 函 数 */ 


27 void SerialIsr (void) 

















30 serialInt = 1; 




















接口 函数 。 如 我 们 要 从 串口 上 发 送 “Hello World" 
字符 串 ， 使 用 语句 SerialSend (“Hello World", 11) 
即 可 。 


























此 可 见 ， 在 没有 操作 系统 的 情况 下 ， 设 备 
驱动 的 接口 被 直接 提交 给 了 应 用 软件 工程 师 ， 应 
用 软件 没有 跨越 任何 层次 就 直接 访问 了 设备 驱动 
的 接口 。 驱 动 包含 的 接口 函数 也 与 硬件 的 功能 
接吻 合 ， 没 有 任何 附加 功能 。 图 1.1 所 示 为 无 操 
帮 系统 情况 下 硬件 、 驱 动 与 应 用 软件 的 关系 。 
有 的 工程 师 把 单 任务 系统 设计 成 了 如 图 1.2 
所 示 的 结构 ， 即 设备 驱动 和 具体 的 应 用 软件 模块 
之 间 平 等 ， 驱 动 中 包含 了 业务 层面 上 的 处 理 ， 这 
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其 他 模块 想 要 使 用 这 个 设备 的 时 候 ， 只 需要 包含 设备 驱动 的 头 文件 serial.h， 然 后 调用 其 中 的 外 部 








应 用 软件 


设备 驱动 


SerialSend LightOn FlashWr 
SerialRecv LightOff FlashRd 





硬件 


1.1 无 操作 系统 时 硬件 、 驱 动 和 应 用 软件 的 关系 








显然 是 不 合理 的 ， 不 符合 软件 设计 中 高 内 聚 、 低 耦合 的 要 求 。 




































































另 一 种 不 合理 的 设计 是 直接 在 应 用 中 操作 硬件 的 寄存 器 ， 而 不 单独 设计 驱动 模块 ， 如 图 1.3 

































































所 示 。 这 种 设计 意味 着 系统 中 不 存在 或 未 能 充分 利 



































设备 驱动 


SerialSend LightOn FlashWr 应 用 软件 
SerialRecv LightOff FlashRd 





12 ”驱动 与 应 用 高 耦合 的 不 合理 设计 








可 被 重用 的 驱动 代码 。 














应 用 软件 


ReadReg ReadMem 
WriteReg WriteMem 











13 ”应 用 直接 访问 硬件 的 不 合理 设计 


1.3 有 操作 系统 时 的 设备 驱动 








1.2 节 中 我 们 看 到 一 个 干净 利落 的 设备 驱动 ， 它 


























接 运行 在 硬件 之 上 ， 不 与 任何 操作 系统 关联 。 
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中 包含 操作 系统 后 ， 设 备 驱动 会 变 得 怎样 ? 
首先 ， 无 操作 系统 时 设备 驱动 的 硬件 操作 工作 仍然 是 必 不 可 少 的 ， 没 有 这 一 部 分 ， 驱 动 不 可 
能 与 硬件 打交道 。 
其 次 ， 我 们 还 需要 将 驱动 融入 内 核 。 为 了 实现 这 种 融合 ， 必 须 在 所 有 设备 的 驱动 中 设计 面向 操作 
系统 内 核 的 接口 ， 这 样 的 接口 由 操作 系统 规定 ， 对 一 类 设备 而 言 结 构 一 致 ， 独 立 于 具体 的 设备 。 
此 可 见 ， 当 系统 中 存在 操作 系统 的 时 候 ， 驱 动 变 成 了 连接 硬件 和 内 核 的 桥梁 。 如 图 1.4， 操 
作 系 统 的 存在 势必 要 求 设备 驱动 附加 更 多 的 代码 和 功能 ， 把 单一 的 “驱使 硬件 设备 行动 ” 变 成 了 
操作 系统 内 与 硬件 交互 的 模块 ， 它 对 外 旦 现 为 操作 
系统 的 API， 不 再 给 应 用 软件 工程 师 直 接 提供 接口 。 
那么 我 们 要 问 ， 有 了 操作 系统 之 后 ， 驱 动 反 而 
变 得 复杂 ， 那 要 操作 系统 干什么 ? 
首先 ， 一 个 复杂 的 软件 系统 需要 处 理 多 个 并 发 的 
王 务 ， 没 有 操作 系统 ， 想 完成 多 任务 并 发 是 很 困难 的 。 
其 次 ， 操 作 系 统 给 我 们 提供 内 存 管理 机 制 。 
个 典型 的 例子 是 ， 对 于 多 数 含 MMU 的 处 理 器 而 言 ， 
Windows、Linux 等 操作 系统 可 以 让 每 个 进程 都 可 
以 独立 地 访问 4GB 的 内 存 空 间 。 
上 述 优点 似乎 并 没有 体现 在 设备 驱动 身上 ， 操 作 
系统 的 存在 给 设备 驱动 究竟 带 来 了 什么 实质 的 好 处 ? 
简 而 言 之 ， 操 作 系统 通过 给 驱动 制造 麻烦 来 达 
到 给 上 层 应 用 提供 便利 的 目的 。 当 驱动 都 按照 操作 系统 给 出 的 独立 于 设备 的 接口 而 设计 ， 那 么 ， 
应 用 程序 将 可 使 用 统一 的 系统 调用 接口 来 访问 各 种 设备 。 对 于 类 UNIX 的 VxWorks、Linux 等 操 
作 系统 而 言 ， 当 应 用 程序 通过 write0 、read0 等 函数 读 写 文件 就 可 访问 各 种 字符 设备 和 块 设备 ， 而 




































































































































































































用 户 应 用 程序 















































操作 系统 API 
























































操作 系统 


设备 驱动 中 独立 于 设备 的 接口 
设备 驱动 中 的 硬件 操作 
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图 1.4 ， 硬件、 驱动、 操作 系统 和 应 用 程序 的 关系 






































































































































































































































不 论 设备 的 具体 类 型 和 工作 方式 ， 那 将 是 怎样 的 便利 ? 


1.4 





1.4.1 设备 的 分 类 及 特点 

计算 机 系统 的 硬件 主要 由 CPU、 存 储 器 和 外 设 组 成 。 随 着 IC 制作 工艺 的 发 展 ， 
的 集成 度 越 来 越 高 ， 往 往 在 CPU 内 部 就 集成 了 存储 器 和 外 设 适配器 。 壁 如， 相当 多 也 
PowerPC, MIPS 等 处 理 器 都 集成 了 UART, IC 控制 器 、USB 控制 器 、SDRAM 控制 器 等 ， 有 的 
处 理 器 还 集成 了 片 内 RAM 和 Flash. 
驱动 针对 的 对 象 是 存储 器 和 外 设 〈 包 括 CPU 内 部 集成 的 存储 器 和 外 设 )， 而 不 是 针对 CPU 核 。 
Linux 将 存储 器 和 外 设 分 为 3 个 基础 大 类 。 








































































































@ 字符 设备 。 
e 块 设备 。 








字符 设备 指 那些 必须 以 串 行 顺序 依次 进行 访问 的 设备 ， 如 触摸 屏 、 磁 带 驱 动 器 、 鼠 标 等 。 块 


网 络 设备 。 
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He 

















设备 可 以 用 任意 顺序 进行 访问 ， 以 块 为 单位 进行 操作 ， 如 硬盘 、 软 驱 等 。 字 符 设备 不 经 过 系统 的 





快速 缓冲 ， 
Flash 设备 ， 符 合 块 设备 的 特点 ， 
字符 






























































而 块 设备 经 过 系统 的 快速 缓冲 。 但 是 ， 字 符 设备 和 块 设 备 并 没有 明显 的 界限 ， 如 对 了 


open0、close0 、read0、write0 等 进行 访问 。 
， 网 络 设 备 面 向 数据 包 的 接收 和 发 送 而 设计 ， 它 并 不 对 应 于 文件 系统 的 节点 。 



























































晶 是 我 们 仍然 可 以 把 它 作 为 一 个 字符 设备 来 访问 。 
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设备 和 块 设 备 的 驱动 设计 呈现 出 很 大 的 差异 ， 但 是 对 于 用 户 而 言 ， 他 们 都 使 用 文件 系统 
的 操作 接口 
在 Linux 系统 ! 
























































内 核 与 网 络 设备 的 通信 与 内 核 和 字符 设备 、 网 络 设备 的 通信 方式 完全 不 同 。 


男 外 一 利 
3 个 基础 大 类 ， 但 是 对 于 
































设备 分 类 方法 中 所 称 的 PC 驱动 、USB 驱动 、PCI 驱动 、LCD 驱动 等 本 身 可 归纳 入 

















这 些 复杂 的 设备 ，Linux 也 定义 了 独特 的 驱动 体系 结构 。 








1.4.2 Linux 设备 驱动 与 整个 软 硬 件 系统 的 关系 





如 图 1.5 所 示 ， 除 网 


























络 设备 外 ， 字 符 设备 与 块 设备 都 被 映射 到 Linux 文件 系统 的 文件 和 目录 ， 






































有 的 字符 











通过 文件 系统 的 系统 调用 
设备 和 块 设备 都 被 统一 地 呈现 给 用 户 。 块 设备 比 字符 设备 复杂 ， 在 它 上 面 会 首先 建立 一 








接口 open0、write0、tread0、closeO 等 即 可 访问 字符 设备 和 块 设 备 。 所 






































个 磁盘 /Flash 文件 系统 ， 如 FAT、EXT3、YAFFS2、JFFS2、UBIFS 等 。FAT、EXT3、YAFFS2、 
JFFS2、UBIFS 定义 了 文件 和 目录 在 存储 介质 上 的 组 织 。 


























用 户 应 用 程序 


磁盘 /Flash 
文件 系统 











应 用 程序 可 以 使 用 Linux 的 系统 调用 接口 编程 
目的 , 后 者 更 值得 推荐 。 

















1.5 Linux 设备 驱动 与 整个 软 硬 件 系 统 的 关系 


， 但 也 可 使 用 C 库 函 数 ， 出 于 代码 可 移植 性 的 
C 库 函 数 本 身 也 通过 系统 调用 接口 而 实现 , 如 C 库 函 数 fopen(). fwrite(). 
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fread()、fclose() 分 别 会 调用 操作 系统 的 APT open(). write(). read(). close(). 


1.4.3 Linux 设备 驱动 的 重点 、 难 点 





















































































































































































































































































































































































































































Linux 设备 驱动 的 学 习 是 一 项 浩 繁 的 工程 ， 包 含 如 下 的 重点 、 难 点 。 
€ 编号 Linux 设备 驱动 要 求 工程 师 有 非常 好 的 硬件 基础 ， 懂 得 SRAM, Flash. SDRAM, 
磁盘 的 读 写 方式 ，UART、LIC、USB 等 设备 的 接口 以 及 轮 询 、 中 断 、DMA 的 原理 ，PCI 
总 线 的 工作 方式 以 及 CPU 的 内 存 管理 单元 (MMU) 等 。 
€ 编写 Linux 设备 驱动 要 求 工 程 师 有 非常 好 的 C 语言 基础 ， 能 灵活 地 运用 C 语言 的 结构 体 、 
指针 、 函 数 指针 及 内 存 动态 申请 和 释放 等 。 
€ 编写 Linux 设备 驱动 要 求 工程 师 有 一 定 的 Linux 内 核 基 础 ， 虽 然 并 不 要 求 工程 师 对 内 核 
各 个 部 分 有 深入 的 研究 ， 但 至 少 要 明白 驱动 与 内 核 的 接口 。 尤 其 是 对 于 块 设 备 、 网 络 设 
f. Flash 设备 、 串 口 设备 等 复杂 设备 ， 内 核定 义 的 驱动 体系 架构 本 身 就 非常 复杂 。 
€ 编写 Linux 设备 驱动 要 求 工程 师 有 非常 好 的 多 任务 并 发 控制 和 同步 的 基础 ， 因 为 在 驱动 
中 会 大 量 使 用 自 旋 锁 、 互 斥 、 信 号 量 、 等 待 队列 等 并 发 与 同步 机 制 。 
上 述 经 验 值 的 获取 并 非 朝 儿 之 事 ， 因 此 要 求 我 们 有 足够 的 学 习 恒 心 和 毅力 。 对 这 些 重点 、 难 
点 ， 本 书 都 会 有 相应 章节 进行 讲解 。 
动手 实践 永远 是 学 习 任 何 软件 开发 的 最 好 方法 ， 学 习 Linux 设备 驱动 也 不 例外 。 因 此 ， 本 书 
专门 配备 了 一 款 基 于 S3C6410 的 ARMII 开发 板 LDD6410 (全 称 Linux Device Drivers 6410， 即 
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1.5.1 PC 上 的 Linux 








本 书 配 套 光盘 提供 了 一 个 Ubuntu 的 VirtualBox 虚拟 机 映像 ， 该 虚拟 机 上 安装 了 所 有 本 





环境 




















的 源 代码 、 工 具 链 和 各 种 开发 














分析 方法 是 点 生 
解 驱 动 的 方法 。 
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吉 合 ， 将 对 函数 

















涉及 



































等 操作 系统 中 ， 运 行 方法 如 下 。 
(1) 解压 缩 安装 盘 内 昌 
需要 16GB 的 空闲 磁盘 空间 )。 



































的 虚拟 机 磁盘 映像 virtual-disk.rar 到 本 地 硬盘 得 





到 





有 具 ， 读 者 无 需 再 安装 和 配置 任何 环境 。 该 虚拟 机 可 运行 于 Windows 


virtual-disk.vdi (84b 
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(2) 安装 安装 盘 内 的 VirtualBox 虚拟 机 软件 。 
(3) 建立 一 个 虚拟 机 。 

CD 单 击 “ 新 建 ”按钮 ， 指 定 虚拟 机 使 用 Linux Ubuntu 系统 ， 如 图 1.6 所 示 。 
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m Sun VirtualBox 


e i 中 | Q mmm | 加 快速 修复 c) | QD süühsii( 
KA i 清除 常规 
zm 设置 () ”开始 (t) WRG) E bere Ead 


BA ubuntu ; 
ozxa [ESTIS 
虚拟 电脑 名 称 和 系统 类 型 
PENEAN E HEEE ESERE 


< EE E » 用 来 区 分 该 虚拟 电脑 的 硬件 配 


系统 类 型 Ubuntu 


和 上 面 的 系统 、 软 件 和 数据 . 


名 称 ( 
系统 类 型 D 
BERHO: 














< 返回 @) | | 下 一 步 Q0 >) 取消 











1.6 VirtualBox 指定 使 用 Ubuntu 























Q 单 击 “ 下 一 步 ” 按 钮 ， 如 图 1.7 所 示 ， 使 用 推荐 的 内 存 384MB 。 








m Sun VirtualBox ETTTT 


Q b EEENSETARFAN MH: M. 
BND W 建议 分 配 的 内 存 大 小 是 384 NB. 
内 存 大 小 员 
= QJ m |384 


1024 MB 
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P 网 络 
网 络 连 接 艺 片 1: PCnet-FAST III (NAT) 
串口 

9 B6 


Ø WSB 设备 
设备 第 选 : 0 (0 活动 ) 








1.7 VirtualBox 中 内 存 设 定 
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© 指定 虚拟 机 磁盘 映像 为 第 一 步 解压 缩 得 到 的 virtual-disk.vdi， 如 图 1.8 所 示 。 


B 2 3 909 Ø 
IEW WMO MoO PERRO) MO 


8 虚拟 硬盘 @) | 已) 虚拟 光盘 C) 上 庶 拟 软盘 E) 


选择 一 个 虚拟 硬盘 
EREET: |O hutu 


[lvirtual-disk. vdi 5 




















文件 名 中 : |rirtaal-disk vài 可 
EKET: 。 | 所 有 虚拟 硬盘 (+. vmdk *. vdi *. whd *. hdd v] 








回回 四 


选择 一 个 虚拟 硬盘 作为 虚拟 电脑 的 主 硬盘 。 你 即 可 以 单 击 新 建 按钮 建立 一 个 
新 的 虚拟 硬盘 ， 也 可 以 在 下 拉 列 表 中 选择 一 个 现 有 的 虚拟 硬盘 ， 或 者 单 击 现 
有 按钮 打开 虚拟 介 质 管理 器 ). 


如 果 你 需要 一 个 更 复杂 的 硬盘 设置 ， 也 可 以 智 略 这 步 ， 以 后 再 在 虚拟 电脑 设 
置 对 话 框 中 指定 硬盘 . 


建议 分 配 的 虚拟 硬盘 大 小 是 : 8192 MB. 
v] 自动 盘 (第 一 ITDE 控 制 器 主 通道 ) (0) 
O 创建 新 的 虚拟 硬盘 (C) 


C 使 用 现 有 的 虚拟 硬盘 QU 


virtual-disk. vdi (Normal, 15.00 GB) 
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网 络 连 接 芯 片 1: PCnet-FAST III (NAT) 
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9 Esd 


Ø VSB 设备 
设备 筛选: 0 (0 活动 ) 








1.8 VirtualBox 中 磁盘 设 定 





© 完成 设置 ， 如 图 1.9 所 示 。 

之 后 就 可 以 启动 虚拟 机 ， 账 号 和 密码 都 是 “lihacker”。 本 书 配套 源 代 码 都 位 于 lihacker 主 目 录 
的 develop 目录 下 ， 几 个 主要 项 目 针 对 /home/lihackerdevelop/ 的 子 目录 如 下 。 

LDD6410 开发 板 内 核 源 代码 : svn/ldd6410-2-6-28-read-only/linux-2.6.28-samsung. 

LDD6410 开发 板 U-BOOT 源 代 码 : svn/ldd6410-read-only/s3c-u-boot-1.1.6。 
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现在 将 根据 下 面 所 列 参 数 他 陡 一 个 新 的 虚拟 电脑 

名 称 : ubuntu-9. 0. 4 

系统 类 型 : Ubuntu 

内 存 大 小 : 384 MB 

主 硬盘 : — virtual-disk vdi (Normal, 16.00 GB) 


如 果 上 面 的 设置 没有 问题 ， 请 按 完成 按钮 。 一 个 新 的 虚拟 电脑 将 被 建 
立 。 

请 注意 : 你 可 以 通过 虚拟 电脑 的 设置 对 话 框 来 更 改 上 面 的 有 关 该 虚拟 电脑 
的 各 种 设置 . 


16.00 GB) 
pS. 45 MB) 





CRISI QD (ERED ) 取消 
Ø ws» 设备 


设备 筛选 0 (0 活动 ) 








1.9 VirtualBox 中 完成 设 定 




















LDD6410 开发 板 文件 系统 用 的 busybox、jpegview、mplayer、appweb 等 : svn/ldd6410-read- 
only/utils。 

LDD6410 开发 板 及 常用 Linux 用 户 空间 驱动 测试 程序 : svn/ldd6410-read-only/tests。 

书 中 globalmem、globalfifo 等 驱动 实例 : svn/ldd6410-read-only/training/kernel。 

Android 的 源 代码 : git/myandroid. 

NDK: android-ndk-r3。 

eclipse: 单 击 桌面 上 的 “android-eclipse” 图 标 ， 即 可 运行 附带 ADT 的 eclipse 开发 工具 。 


1.5.2 LDD6410 开发 板 


LDD6410 是 本 书 专 配 的 一 款 高 端 ARM11 处 理 器 开发 板 〈 其 结构 如 图 1.10 所 示 ， 实 物 如 
图 1.11 所 示 )， 采 用 三 星 公司 最 新 推出 S3C6410 处 理 器 ， 芯 片 拥有 强大 的 内 部 资源 和 视频 处 理 能 
力 ， 板 上 集成 了 丰富 的 外 围 接 口 ， 其 主要 特点 如 下 。 

CD 运行 于 533MHz 的 ARMII 处 理 器 (最 高 主 频 可 达到 667MHz )。 

(2) 运行 于 266MHz 的 DDR 内 存 ，128MB。 

(3) 1MB NOR Flash. 

(4) 256MB NAND Flash. 

(5) WM9714 AC97 声卡 。 

(6) VGA 输出 接口 〈 可 达 1024x768(60Hz) . 

(7) TV 输出 接口 。 

(8) USB 2.0 OTG 接口 及 USB 1.1 host 接口 。 
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LDD6410 开发 板结 构 





1.10 LDD6410 的 结构 图 


MU IRAARULNHREI 


| 





图 1.11 LDD6410 实物 图 
(9) SD/SDIO 接口 ， 支 持 SD 卡 和 SDIO 设备 。 
(100 DM9000 百 兆 网 卡 。 
(11) 4.3 寸 LCD 分辨 率 为 480x272)、 和 触摸屏 。 
(12) S3C6410 蕊 片 内 骨 图 形 加 速 ， 卫 EG、 多 媒体 编 解码 。 
(13) 6 个 GPIO 按键 。 
(14) 可 扩展 Camera、WiFi、3G modem 等 模块 。 
(150 可 扩展 外 部 矩阵 键盘 。 
配套 电路 板 提 供 了 如 下 软件 。 


CD TRE: 提供 了 arm-linux-gcc、arm-linux-gdb、gdbserver、strace 用 于 Android 开发 的 eclipse 
GE ADT 插件 )、JDK 和 NDK。 
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pu 















































(2) U-BOOT: U-BOOT 源 代码 包含 独立 的 LDD6410 文件 ， 支 持 从 SD 卡 、NAND 启动 ， 支 
持 DM9000 网 卡 引 导 。 

















整 的 设备 驱动 。 
(4) 文件 系统 : 基于 新 版 Busybox 1.15.1， 文 件 系 统 集成 jpegview、mplayer、appweb 等 大 
， 集 成 了 按键 、 鼠 标 、 和 触摸 屏 、LCD 等 测试 程序 ， 作 为 驱动 的 用 户 应 用 案例 。 

(5) Android: 提供 Android 源 代 码 和 文件 系统 、 内 核电 源 管 理 补 丁 源 代 码 、 内 核 Android 驱动 源 
代码 。LDD6410 的 Android 系统 支持 按键 、 触 摸 屏 和 鼠标 操作 ， 支 持 使 用 LCD 和 VGA 进行 显示 。 
(60 QT: LDD6410 支持 QUEmbedded 4.5.3， 移 植 了 Ts lib 和 Tslib, ts calibration; xc Hf HI 
摸 屏 进 行 操作 。 


fih 
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(3) Linux 内 核 、BSP 和 驱动 : Linux 2.6.28 内 核 、 源 代码 ， 包 含 独立 的 LDD6410 BSP 和 完 
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LDD6410 支持 从 SD 卡 或 NAND 启动 ， 通 过 电路 板 上 的 SW1 可 设置 LDD6410 的 启动 模式 。 








SD 卡 启 





LDD6410 开发 板 的 详细 使 用 方法 ， 请 见 配套 光盘 























动 设备 为 全 ON; 从 NAND 启动 时 ， 将 1. 2 设置 为 ON，3、4 设置 为 OFF。 
的 “LDD6410 开发 板 用 户 手册 ” 






















































































153 ”工具 链 安装 
本 书 配套 光盘 的 虚拟 机 映像 中 已 经 安装 好 了 LDD6410 的 工具 链 ， 读 者 如 果 想 在 其 他 环境 中 
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女 
Bir 








具 链 为 S 












































装 ， 只 需要 从 http://1dd6410.googlecode.com/files/cross-4.2.2- eabi.tar.bz2 下 载 。LDD6410 开发 板 


3C6410X-ToolChain4.2.2- EABI- V0.0- cross- 4.2.2- eabi.tar。 安 装 步 又 如 下 。 








(1) 解压 上 述 工具 链 获 得 文件 来: 4.2.2-eabi/。 
(2) 在 /usr/local/ 下 面 创建 目录 arm/( 注 意 ， 最 好 是 放 到 这 个 目录 ， 不 然 在 以 后 的 编译 过 程 中 
可 能 出 现 一 些 错 误 )。 


(3) 将 目录 4.2.2-eabi/ 移 动 到 /usr/local/arm/ 下 面 。 
(4) 设置 环境 变量 。 
前 辑 /etc/profile 文件 ， 在 文件 末尾 添加 : 


PATH-"$PATH:/usr/local/arm/4.2.2-eabi/usr/bin" 
export PATH 





AN 
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男 外 ， 





使 环境 变量 生效 ， 在 终端 输入 命令 : 


source /etc/profile 











也 可 以 通过 修改 home 目录 的 .bashrc 来 将 /usr/local/arm/4.2.2-eabi/usr/bin 添加 到 PATH: 





export PATH-/usr/local/arm/4.2.2-eabi/usr/bin/:$PATH 
























































C5) 测试 环境 变量 是 否 设置 成 功 。 

在 终端 输入 : echo SPATH， 如 果 输 出 的 路 径 中 包含 了 /usvlocalarm/4.2.2-eabi/usrbin， 则 说 明 
环境 变量 设置 成 功 。 

C6) 测试 交叉 编译 工具 链 。 






































在 终端 输入 “arm-linux-gcc =v”, 显示 如 下 : 


Using 


built-in specs. 


Target: arm-unknown-linux-gnueabi 


Configured with: 


/home/ 
(eyed 


scsuh/workplace/coffee/buildroot-20071011/toolchain build arm 
.2.2/configure --prefix-/usr --build-i386-pc-linux-gnu --host-i386-pc-linux-gnu 


--target-arm-unknown-linux-gnueabi --enable-languages-c,c-4* --with-sysroot-/usr/local 
/arm/4.2.2-eabi/ --with-build-time-tools-/usr/local/arm/4.2.2-eabi//usr/arm-unknown-linux- 


gnueab 


i/bin --disable-cxa atexit --enable-target-optspace --with-gnu-ld --enable-shared 
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--with-gmp-/usr/local/arm/4.2.2-eabi/gmp --with-mpfr-/usr/local/arm/4.2.2-eabi//mpfr 
--disable-nls --enable-threads --disable-multilib --disable-largefile --with-arch-armv4t 
--with-float-soft --enable-cxx-flags--msoft-float 


Thread model: posix gcc version 4.2.2 


说 明 交 叉 编 译 工 具 链 已 经 安装 成 功 。 
1dd6410-debug-tools.tar.gz 调试 工具 包 包 含 了 strace, gdbserver 和 arm-linux-gdb， 





























H strace, 



















































































gdbserver 用 于 目标 板 文件 系统 ，arm-linux-gdb 运行 于 主机 端 ， 对 目标 板 上 的 内 核 、 内 核 模 块 应 用 
程序 进行 调试 。 
下 载 地 址 为 http:/ldd6410.googlecode.comyfiles/ldd6410-debug-tools.tar.gz， 光 盘 目 录 为 toolchains/ 


ldd6410-debug-tools.tar.gz o- 


解压 1dd6410-debug-tools.tar.gz, 将 其 























中 的 arm-linux-gdb 放 入 主机 上 arm-linux-gec 所 在 的 日 








3K/usr/local/arm/4.2.2-eabi/usr/bin/. 





标 机 根 文件 系统 的 /usr/sbin 目录 。 





而 strace、gdbserver 则 可 根据 需要 放 入 目 


1.5.4 主机 端 nfs 和 tftp 服务 安装 
































] tftp 或 nfs 文件 系统 
Pu. 





本 书 配套 光盘 的 虚拟 机 映像 中 已 经 安装 好 了 nk 和 tftp, LDD6410 可 使 





















































主机 通过 网 




















口交 互 。 如 果 用 户 想 在 其 他 环境 下 自行 安装 ， 对 于 Ubuntu 或 Debian 用 











1.5.5 


Insight， 在 其 
将 可 以 非常 方便 地 在 代码 之 间 进 行 关联 阅 


Linux 内 核 ! 
的 所 有 位 置 。 还 有 一 些 网 站 也 提供 了 Linux 内 核 中 函数 、 变 量 和 数据 结构 的 搜索 能 





几 端 可 通过 如 下 方法 安装 tftp 服务 : 
sudo apt-get install tftpd-hpa 
开启 tftp 服务 : 
sudo /etc/init.d/tftpdhpa start 
Sree HIA ee cl 
对 于 Ubuntu 或 Debian 用 户 而 言 ， 在 主机 端 可 通过 如 下 方法 安装 nfs 服务 : 
apt-get install nfs-kernel-server 


sudo mkdir /home/nfs 
sudo chmod 777 /home/nfs 


运行 “sudo vim /etc/exports" 8X "sudo gedit /etc/exports”， 修 改 该 文件 内 容 为 : 
/home/nfs *(sync,rw) 
运行 exportfs rv 开启 NFS 服务 : 


/etc/init.d/nfs-kernel-server restart 


源 代码 阅读 和 编辑 

源 代码 是 学 习 Linux 的 最 权威 资料 ， 在 Windows 上 阅读 Linux 源 代 码 的 最 佳 工具 是 Source 
中 建立 一 个 工程 ， 并 将 Linux 的 所 有 源 代码 加 入 该 工程 ， 同 步 这 个 工程 之 后 ， 我 们 
读 ， 如 图 1.12 所 示 。 

网 站 http://lxr.linux.no/ 提 供 了 内 核 版 本 2.6.11 到 最 新 版 Linux 源 代码 的 交叉 索引 ， 在 其 中 输入 
的 函数 、 数 据 结 构 或 变量 的 名 称 就 可 以 直接 得 到 以 超 链接 形式 给 出 的 定义 和 引用 它 
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， 在 google 


























个 文本 乡 
作 的 vim 编辑 器 ， 如 





搜索 “1linux identifier search” 可 得 。 

















vim 是 一 





在 Linux 主机 上 阅读 和 编辑 Linux 源码 的 常用 方式 是 vim + cscope 或 者 vim + ctags， 
有 辑 器 ， 而 cscope 和 ctags 则 可 建立 代码 索引 ， 建 议 读者 尽快 使 用 基于 文本 界面 全 键盘 操 
图 1.13 所 示 。 
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eo 



















Linux Project - Source Insight - [I2c-core.c (linux-2.6. 1G6XdriversUi2c)1 -ioj xl 
[EE File Edit Search Project Üptions View Window Help Work -Is| xl 
I " } ] 
jDc EHE &!xsmiB)/o:gjae.es:sgses»on3ls8a-u0td»,|g!| 
I2c-core.c ne 2| Linux Project € 型 -| 旧 lx| 

} X 
[E i2c add adapter a] i2 li t Í Fie Name B 
E i2c attach. client void lec, clients, con 12c-amdz56.c (linux 
E i2c bus resume t PN 
E i2c. bus suspend struct list head ho it 
€ i2c bus type struct i2c client *cl 


E i2e check, addr 
lg. i2c check addr 
E i2c client release 


























国 if ( try modul. | 

a i2c control 3 continue; | 

E i2c_dec_use_client = if (NULL! = cie | 

E i2c del adapter up(&adap | 

E i2c del driver = dient-»dri | 

E i2c detach client down(&ad 

E i2c device match H 

图 i2c device probe module put(cl B.15^includeN 
E i2c device remove b - ， +2.6.165driv 
国 i2c_exit xl ^ up(&adap- »clist lo: | 165drivers 
fs $2] a | H 





Function in I2c-core.c [linux-2.6.16\drivers\i2c) at line 511 (19 lines) 


void ripe CM C nn (struct i2c adapter *adap, unsigned int cmd, void *arg) P 





struct list head *item; 
struct i2c client *client; - 


a] Ee a 8| 


| Line511 Col15 i2c clients command 





Checking for modified files... — [INS 





1.12. f£ Source Insight 中 阅读 Linux 源 代码 


File Edit View Terminal Tabs Help 


arch/arm/mach-s3c6410/mach-ldd6410.c 





1.13 vim 编辑 器 


MG 设备 驱动 Hello World : LED 驱动 


1.6.1 无 操作 系统 时 的 LED 驱动 
在 嵌入 式 系统 的 设计 中 ，LED 一 般 直 接 由 CPU 的 GPIO GB FI nf 4g 
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一 般 由 两 组 寄存 器 控制 ， 即 一 组 控制 寄存 器 和 一 组 数据 寄存 器 。 控 制 寄存 器 可 设置 GPIO 口 的 了 
作 方 式 为 输入 或 是 输出 。 当 引 脚 被 设置 为 输出 时 ， 向 数据 寄存 器 的 对 应 位 写 入 1 和 0 会 分 别 在 引 
脚 上 产生 高 电 平和 低 电 平 ， 当 引 脚 设置 为 输入 时 ， 读 取 数 据 寄存 器 的 对 应 位 可 获得 引 脚 上 的 电 习 

在 本 例子 中 ， 我 们 屏蔽 具体 CPU 的 差异 ， 假 设 在 GPIO_REG_CTRL 物理 地 址 处 的 控制 寄存 
器 处 的 第 nn 位 写 入 1 可 设置 GPIO 为 输出 ,在 地 址 GPIO REG. DATA 物理 地 址 处 的 数据 寄存 器 的 
第 nn 位 写 入 1 或 0 可 在 引 脚 上 产生 高 或 低 电 平 ， 则 无 操作 系统 的 情况 下 ， 设 备 驱 动 为 代码 清单 1.3。 


代码 清单 1.3 ”无 操作 系统 时 的 LED 驱动 
define reg gpio ctrl *(volatile int *) (ToVirtual(GPIO REG CTRLI)) 
define reg gpio data *(volatile int *) (ToVirtual(GPIO REG DATA)) 
/* 初 始 化 LED*/ 
void LightInit (void) 
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isi 



























































































































































* 





reg gpio ctrl |= (1 << n); /* 设 置 GPIO 为 输出 */ 











£O US cod Ud Ortho TF 


/* 点 亮 LED*/ 
void LightOn (void) 
{ 








reg gpio data |= (1 << n); /* 在 GPIO 上 输出 高 电 平 */ 
} 





void LightOff (void) 
( 
reg gpio data &-2 —(1 «« n); /*fEGPIO Lfd or / 











0 
Hi 
2 
3 
4 
5 AEIR LED*/ 
6 
d 
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上述 程序 中 的 LightInit()、LightOn()、LightOff0 都 直接 作为 驱动 提供 给 应 用 程序 的 外 部 接口 
函数 。 程 序 中 ToVirtual0 的 作用 是 当 系统 启动 了 硬件 MMU 之 后 ， 根 据 物理 地 址 和 虚拟 地 址 的 映 
射 关系 ， 将 寄存 器 的 物理 地 址 转化 为 虚拟 地 址 。 


1.6.2 Linux 下 的 LED 驱动 
在 Linux 下 ， 可 以 使 用 字符 设备 驱动 的 框架 来 编写 对 应 于 代码 清单 1.3 的 LED. 设备 驱动 (这 


里 仅仅 是 为 了 讲解 的 方便 , 到 后 文 我 们 会 发 现 ， 内核 中 实际 实现 了 一 个 提供 sysfs 结 点 的 GPIO LED 
区 动 ， 位 于 drivers/leds/leds-gpio.c)， 操 作 硬 件 的 Lightmit0、LightOnO0、LightOfftO 函 数 仍然 需要 ， 
但 是 ， 遵 循 Linux 编程 的 命名 习惯 ， 重 新 将 其 命名 为 light_init()、light_on()、light_off()。 这 些 函 
数 将 被 LED 设备 驱动 中 独立 于 设备 的 针对 内 核 的 接口 进行 调用 ， 代 码 清单 1.4 给 出 了 Linux 下 LED 
的 驱动 ， 此 时 读者 并 不 需要 能 读 懂 这 些 代码 。 


代码 清单 1.4 Linux 操作 系统 下 LED 的 驱动 
1 #include .../* 包 含 内 核 中 的 多 个 头 文件 */ 
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2 /* 设 备 结构 体 */ 
SL Aen iade robe Wi 
4 struct cdev cdev; /* 字 符 设备 cdev 结构 体 */ 
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unsigned char vaule; /*LED 亮 时 为 1， 熄 灭 时 为 0， 用 户 可 读 写 此 值 */ 





}; 


struct light dev *light devp; 
int light major - LIGHT MAJOR; 


MODULE AUTHOR("Barry Song «21cnbaoG8gmail.com»"); 
MODULE LICENSE ("Dual BSD/GPL"); 

/* 打 开 和 关闭 函数 */ 

int light open(struct inode *inode, struct file *filp) 


{ 














struct light dev *dev; 

/* 获得 设备 结构 体 指针 */ 

dev = container of(inode-»i cdev, struct light dev, cdev); 
/* 让 设备 结构 体 作为 设备 的 私有 信息 */ 

filp->private data = dev; 


return 0; 


int light release(struct inode *inode, struct file *filp) 
( 


return 0; 











/* 读 写 设备 :可 以 不 需要 */ 
TI 
Iori e Si CS) 


struct light dev *dev = filp->private_data; /* 获 得 设备 结构 体 */ 
if (copy to user(buf, &(dev-»value), 1)) 


return  -EFAULT; 


return 1; 


Ssize t light write(struct file *filp, const char user *buf, size t count, 


diese: de "ue doxes) 
struct light dev *dev = filp-»private data; 


if (copy from user(&(dev-»value), buf, 1) 
return  -EFAULT; 


/*# 根 据 写 入 的 值 点 亮 和 熄灭 LED* / 


if (dev-»value == 1) 
da «oxi 2 
else 
IdpnBRCOET( 


return 1; 


/* ioctl HZ */ 
sese ligat voxel ((üenescwiere Mode vance cre cile ed ne onal ine (edel. 
unsigned long arg) 


00G 
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ONE 

S struct light dev *dev = filp->private_data; 
52 switch (cmd) ( 

53 case LIGHT ON: 

54 dev-»value = 1; 
D daei (xo (0) 5 

56 break; 

5 case LIGHT OFF: 

58 dev-»value = 0; 
59 aeie Oe (15 

60 break; 

61 default: 

62 /* 不 能 支持 的 命令 */ 
63 return -ENOTTY; 
64 ) 

65 return 0; 

GE j 


67 struct file operations light fops - ( 


68 .owner = THIS MODULE, 

69 .read - light read, 

70 .write - light write, 

71 colexeicdL be oe 3 oxere lr 

T2 .open = light open, 

ES .release - light release, 
TAS gn 


75 /* 设 置 字 符 设备 cdev 结构 体 */ 
76 static void light setup cdev(struct light dev *dev, int index) 


Nu 

78 int err, devno - MKDEV(light major, index); 

79 cdev_init (&dev->cdev, &light_fops); 

80 dev->cdev.owner = THIS_MODULE; 

81 dev->cdev.ops = &light_fops; 

82 err = cdev add(&dev-»cdev, devno, 1); 

83 iE CENTS) 

84 printk(KERN NOTICE "Error $d adding LED$Zd", err, index); 
eo p 


86 /* 模 块 加 载 函 数 */ 
ST unt Light imit(vois) 




















SOME 

89 int result; 

90 dev t dev = MKDEV(light major, 0); 

91 /* 申请 字符 设备 号 */ 

VES zt (riene magor) 

93 result - register chrdev region(dev, 1, "LED"); 
94 else { 

95 result = alloc chrdev region(&dev, 0, 1, "LED"); 
96 light major = MAJOR (dev); 

9, ) 

98 ad (esuke « 0) 

29 return result; 
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00 /* 分 配 设备 结构 体 的 内 存 */ 

01 light devp = kmalloc(sizeof(struct light dev), GFP KERNEL); 
02 Qf (Cl devp) 4 

03 result = -ENOMEM; 

04 oCo eeri ne Ee 

05 } 

06 memset(light devp, 0, sizeof (struct light dev)); 
(QU light setup cdev (light devp, 0); 

08 IXchbogpio A (CN) 

09 return 0; 

Oe ne 

El unregister chrdev region(dev, light devp); 

2 return result; 

s 


4 /* 模 块 和 卸载 函数 */ 

5 void light cleanup (void) 

B 

7 cdev del(&light devp-»cdev); /# 删 除 字符 设备 结构 体 */ 

8 kfree(light devp); /* 释 放 在 1ight_init 中 分 配 的 内 存 */ 

9 unregister chrdev region(MKDEV(light major, 0), 1); /* 删 除 字 符 设 备 */ 
0 








} 


2 ere guise (aeie eati). g 
22 module exit(light cleanup); 


上 述 代码 的 行 数 与 代码 清单 1.3 已 经 不 能 比拟 , 除了 代码 清单 1.3 中 的 硬件 操作 函数 仍然 需要 外 ， 
尺码 清单 1.4 中 还 包含 了 大 量 对 我 们 和 暂时 陌生 的 元 素 ， 如 结构 体 file operations. cdev, Linux 内 核 模 
块 声明 用 的 MODULE AUTHOR. MODULE LICENSE, module init、module_exit， 以 及 用 于 字符 设 
备注 册 、 分 配 和 注销 用 的 函数 register chrdev region(). alloc chrdev region(). unregister chrdev region() 
等 。 我 们 也 不 能 理解 为 什么 驱动 中 要 包含 light_init ()、light_cleanup (~ light read(). light write() 
此 时 ， 我 们 只 需要 有 一 个 感性 认识 ， 那 就 是 ， 上 述 暂 时 陌生 的 元 素 都 是 Linux 内 核 给 字符 设 
备 定义 的 为 实现 驱动 与 内 核 接口 而 定义 的 。Linux 对 各 类 设备 的 驱动 都 定义 了 类 似 的 数据 结构 和 


1.7 in 


本 书 第 1 篇 给 您 打下 Linux 设备 驱动 的 基础 。 第 1 章 简要 地 介绍 了 设备 驱动 的 作用 ， 并 从 无 
操作 系统 的 设备 驱动 引出 了 Linux 操作 系统 下 的 设备 驱动 ， 介 绍 了 本 书 所 基于 的 开发 环境 。 第 2 章 
系统 地 讲解 了 一 个 Linux 驱动 工程 师 应 该 掌握 的 硬件 知识 ， 为 工程 师 打 下 Linux 驱动 编程 的 硬件 基 
解 了 各 种 类 型 的 CPU、 存 储 器 和 常见 的 外 设 ， 并 阐述 了 硬件 时 序 分 析 方 法 和 数据 手册 阅读 方 

3 章 将 Linux 设备 驱动 放 在 Linux 2.6 区 背景 中 进行 讲解 ， 说 明 Linux 内 核 的 编程 方法 。 
于 驱动 编程 也 在 内 核 编 程 的 范畴 ， 因 此 ， 这 一 章 实质 是 为 编写 Linux 设备 驱动 打下 软件 基础 。 
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第 2 篇 讲解 Linux 设备 驱动 编程 的 基础 理论 、 字 符 设备 驱动 及 设备 驱动 设计 中 涉及 的 并 发 控 
































设备 globalmem 和 globalfifo 为 主线 ， 









































驱动 编程 中 所 涉及 的 中 断 和 定时 器 、 内 核 和 IO 操作 处 到 
驱动 工程 化 的 一 些 问 题 ， 属 于 承前启后 的 一 章 。 

















逐步 给 其 添加 高 级 控制 功能 




















制 、 同 步 等 问题 。 第 4、5 章 分 别 讲解 Linux 内 核 模块 和 Linux 设备 文人 


A 


«—e 





系统 ， 第 6 一 9 章 以 虚拟 





10、11 章 分 别 阐述 Linux 








方法 ， 本 篇 的 第 12 章 讲 解 了 Linux 设备 


第 3 篇 剖析 复杂 设备 驱动 的 体系 架构 ， 每 一 章 都 给 出 了 具体 的 实例 。 所 涉及 的 设备 包括 块 设 












































备 
等 























强调 多 快 好 省 ， 因 此 ， 如 果 能 方便 地 
































































































































几 章 对 Linux 设备 驱动 移植 中 涉及 的 ] 














星 论 以 及 移植 的 技巧 进行 也 


























似 设 备 的 驱动 进行 简单 修改 就 运用 于 新 的 设备 ， 那 将 会 极 大 地 缩短 工程 的 实施 时 间 。 本 书 的 


解 。 




















种 设备 驱动 的 设计 ， 然 后 


、 终 端 设备 、PC 适配器 与 TC 设备 、 网 络 设备 、PCI 设备 、USB 设备 、LCD 设备 、Flash 设备 

。 这 一 部 分 的 讲解 方法 是 抽象 与 具体 相 结 合 ， 先 以 模板 的 形式 给 出 

具体 实例 设备 的 驱动 填充 对 应 的 模板 。 
第 4 篇 分 析 了 Linux 设备 驱动 的 调试 和 移植 方法 。 由 于 在 Linux 设备 驱动 的 设计 工作 中 人 们 

巴 现 有 的 其 他 平台 中 的 驱动 移植 到 Linux 2.6 平台 ， 或 者 将 类 





























本 章 导读 





本 章 讲述 一 个 底层 驱动 工程 师 必 
件 原理 及 分 析 方法 的 一 个 完整 而 简洁 的 全 景 视图 。 






































备 的 硬件 基础 ， 给 出 了 岁入 式 系 统 硬 




















2. 节 描 述 了 微 控 制 器 、 微 处 理 器 、 数 字 信 号 处 理 器 以 及 应 上 








于 特定 
































领域 的 处 理 器 各 自 的 特点 ， 分 析 了 处 理 器 的 体系 架构 和 指令 集 。 




































































2.2 节 对 典 入 式 系统 中 所 使 用 的 各 类 存储 器 与 CPU 的 接口 、 应 








领域 


























及 特点 进行 了 归纳 整理 。 
2.3 节 分 析 了 常见 的 外 设 接口 与 总 线 的 工作 方式 ， 包 括 串 口 


























USB、 以 太 网 接口 、ISA、PCI 和 cPCI 等 。 





髓 入 式 系统 硬件 电路 中 经 常会 使 用 CPLD 和 FPGA, 作为 驱动 工程 师 ， 
我 们 不 需要 掌握 CPLD 和 FPGA 的 开发 方法 ， 但 是 需要 知道 它们 在 电路 















































能 完成 什么 工作 ，2.4 节 讲 解 了 这 项 内 容 。 
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PC, 








2.5—2.7 节 给 出 了 在 实际 项 目 开 发 过 程 中 硬件 分 析 的 方法 ， 包 括 如 何 
进行 原理 图 分 析 、 时 序 分 析 及 如 何 快速 地 从 芯片 手册 获取 有 效 信息 。 























2.8 节 讲 解 了 调试 过 程 中 常用 仪器 仪表 的 使 用 方法 ， 涉 及 万 用 


























波 占 和 逻辑 分 析 仪 。 
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2. E 


2.1.1 通用 处 理 器 
通用 处 理 器 (GPP)〉 并 不 针对 特定 的 应 用 领域 进行 体系 结构 和 指令 集 的 优化 ， 它 们 有 具 有 一 般 
化 的 通用 体系 结构 和 指令 集 ， 以 求 支 持 复 杂 的 运算 并 易于 添加 新 开发 的 功能 。 一 般 而 言 ， 在 谋 入 
式微 控制 器 CMCUO 和 微 处 理 器 (MPU) 中 会 包含 一 个 通用 处 理 器 核 。 
MPU 通常 代表 一 个 CPU 〈 中 央 处 理 器 )， 而 MCU 则 强调 把 中 央 处 理 器 、 存 储 器 和 外 围 电 路 
集成 在 一 个 芯片 中 。 早 期 ， 微 控制 器 被 称 为 单片机 ， 指 把 计算 机 集成 在 一 个 芯片 内 。 峙 入 式微 控 
制 器 也 常 被 称 作 片上 系统 (SoC)， 含 义 是 在 一 个 芯片 上 设计 了 整个 系统 。 芯 片 厂商 在 推出 MCU 
时 ， 往 往 会 有 明确 的 市 场 定 位 ， 如 定位 于 PDA、MP3、ADSL 等 。 定 位 不 同 的 产品 可 能 包含 3 
的 CPU 核 , 但 是 集成 的 扩展 电路 则 不 一 样 。 图 2.1 所 示 给 出 了 一 个 典型 的 集成 了 外 围 电 路 的 MCU 
的 结构 。 
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存储 控制 器 CPU 核 USB 控制 器 








2.1 典型 的 MCU 内 部 结构 









































举 个 例子 ，Intel 的 80386 属于 微 处 理 器 ,而 内 部 集成 了 80386 处 理 器 、 片 选单 元 、 中 断 控制 、 
定时 器 、 看 门 狗 定 时 器 、 串 行 JO、DMA 和 总 线 仲裁 、DRAM 控制 器 等 的 386EX 则 是 80386 微 
处 理 器 的 微 控 制 器 版 本 。 但 是 ， 要 说 明 的 是 ，GPP、MCU 和 MPU 等 概念 其 实 非 常 含 糊 ， 许 多 地 
方 并 不 加 以 区 分 ， 而 明确 区 分 这 些 概念 在 技术 上 本 身 也 没有 太 大 的 意义 。 

和 能 入 式微 控制 器 一 般 由 一 个 CPU 核 和 多 个 外 围 电路 集成 ， 目 前 主流 的 谋 入 式 CPU 核 有 如 下 几 种 。 

€ Advanced RISC Machines 公司 的 ARM. 

ARM 内 核 的 设计 技术 被 授权 给 数 百 家 半 导体 厂商 ， 做 成 不 同 的 SoC 芯片 。ARM 的 功 耗 很 低 ， 
在 当今 最 活跃 的 无 线 局 域 网 、3G、 手 机 终端 、 手 持 设 备 、 有 线 网 络 通信 设备 等 中 应 用 非常 广泛 。 
本 书 所 基于 的 LDD6410 开发 板 上 采用 的 就 是 S3C6410 这 个 ARM SoC 芯片 。 

€ MIPS 技术 公司 的 MIPS. 

两 个 最 重要 的 MIPS 芯片 厂商 为 PMC 和 IDT, PMC-Sierra 公司 的 MIPS 处 理 器 被 CISCO 公 
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j 在 高 端 路 由 器 上 。 











HAE 
也 尝试 增加 


于 低 端 通 























PowerPC 处 理 器 是 通信 和 工控 领域 应 用 最 广泛 的 处 理 器 ， 国 














司 都 大 量 使 用 
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€ Motorola 公司 独 


了 HDLC, Ethernet, $ O, 
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SDRAM 


IBM 和 Motorola 的 PowerPC. 


















































上 集成 PCI 接 
控制 器 、 片 选 、DMA 控制 
































MPC860 和 MPC8260 是 其 最 经 典 的 两 款 。 
的 内 核 68K/COLDFIRE。 


mi , 
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广泛 














内 包括 华为 、! 


] 于 以 太 网 交换 
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等 外 设 接 口 ， 




















兴 在 内 的 通信 
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IKT 68K 的 特点 并 对 其 保持 了 兼容 。Coldfire 内 核 被 月 
















































































HF DSP 模块 、CAN 总 线 模块 以 及 一 般 符 入 


式 处 理 器 所 集成 的 外 设 模块 ， 在 工业 控制 、 机 器 人 研究 、 家 电 控 制 等 领域 被 广泛 采用 。 
: Motorola 的 半导体 部 已 经 独立 为 飞 思 卡 尔 半 导体 公司 ( Freescale Semiconductor Inc. )， 
JA 历史 原因 ， 上 文 仍然 使 用 Motorolas 
中 央 处 理 器 的 体系 架构 可 以 分 为 两 类 ， 一 类 为 双 ，。 诺 伊 曼 结构 ， 一 类 为 哈佛 结构 。 
冯 。 诺 伊 曼 结构 也 称 普 林 斯 顿 结构 ， 是 一 种 将 程序 指令 存储 器 和 数据 存储 器 合并 在 一 起 的 存 
储 器 结构 。 程 序 指令 存储 地 址 和 数据 存储 地 址 指向 同一 个 存储 器 的 不 同 物理 位 置 ， 因 此 程序 指令 











和 数据 的 宽度 相同 。 而 哈 俩 











此 外 ， 哈 佛 结构 还 采用 了 独立 的 程序 总 线 和 数据 总 线 ， 分 别 作 为 CPU 与 每 个 存储 器 之 间 的 专 

















信 路 径 ， 具 有 较 高 的 执行 效率 。 图 2.2 描述 了 冯 。 诺 伊 曼 结构 和 只 人 





从 指令 





























结构 将 程序 指令 和 数据 分 天 








存储 器 


(程序 和 操作 数 ) 


cm 


22 冯 : 诺 伊 曼 结 构 与 哈佛 结构 






































期 长 ， 而 RISC 强调 尽 可 能 ; 
PowerPC 等 CPU 内 核 都 采用 了 


的 角度 来 讲 ， 中 央 处 理 器 也 可 以 分 为 两 
(复杂 指令 集 计 算 机 )。CSIC 强调 增强 指令 的 能 力 、 减 少 目 
咸 少 指令 集 、 指 令 单 周期 执行 ， 但 是 
RISC 指令 集 。 目 前 




































































结构 的 


























2.1.2 ”数字 信号 处 理 器 


数字 信号 处 理 器 (DSP) 











针对 通信 、 














图 像 、 语 音 和 视频 处 型 




















F 存储， 指令 和 数据 可 以 有 不 同 的 数据 宽度 。 





区 别 。 





冯 : 诺 伊 曼 结构 


哈佛 结构 





























j 通 





类 ， 即 RISC〈 精 简 指令 集 计 算 机 ) 和 CISC 
标 代码 的 数量 , 但 是 指令 复杂 ， 
目标 代码 会 更 大 。ARM、 
，RISC 和 CSIC 二 者 的 融合 非常 明显 。 


指令 周 


MIPS、 


E 等 领域 的 算法 而 设计 。 它 包含 独 
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立 的 硬件 乘法 器 。DSP 的 乘法 指令 一 般 在 单 周期 内 完成 ， 且 优化 了 卷 积 、 数 字 滤 波 、FFT (快速 
傅立叶 变换 )、 相 关 、 和 矩阵 运算 等 算法 中 的 大 量 重复 乘法 。 
DSP 一 般 采 用 如 图 2.3 所 示 的 改进 的 哈佛 架构 ， 它 具有 独立 的 地 址 总 线 和 数据 总 线 ， 两 条 总 


线 由 程序 存储 器 和 数据 存储 器 分 时 共用 。 
存储 器 操作 数 存储 器 
DSP 分 为 两 类 ， 一 类 是 定点 DSP， 一 类 是 浮 点 DSP。 浮 点 DSP 的 浮 点 运算 用 硬件 来 实现 ， 


可 以 在 单 周 期 内 完成 ， 因 而 其 浮 点 运算 处 理 速度 高 于 定点 DSP。 而 定点 DSP 只 能 用 定点 运算 模拟 
浮 点 运算 。 
德州 仪器 (TI)、 美 国 模拟 器 件 公司 ADD 是 全 球 DSP 的 两 大 主要 厂商 。 

TI 的 TMS320™DSP 平台 包含 了 功能 不 同 的 多 个 系列 如 2000 系列 、3000 系列 、4000 系列 、 
5000 系列 、6000 系列 ， 工 程 师 也 习惯 称 其 为 2X、3X、4X、5X、6X。2010 年 5 月 ，TI 已 经 宣布 
为 其 C64x 系列 数字 信号 处 理 器 与 多 核 片上 系统 提供 Linux 内 核 支持 ， 以 充分 满足 通信 和 与 关键 任 
务 基础 设施 、 医 疗 诊断 以 及 高 性 能 测量 测试 等 应 用 需求 。TI 对 C64x Linux 内 核 的 产品 支持 
TMS320C6474、TMS320C6455 和 TMS320C6457， 将 于 2010 年 第 3 季度 开始 提供 。 

ADI 主要 有 16 位 定点 的 21xx 系列 、32 位 浮 点 的 SHARC 系列 、 从 SHARC 系列 发 展 而 来 的 
TigerSHARC 系列 及 高 性 能 16 位 DSP 信号 处 理 能 力 与 通用 微 控制 器 方便 性 相 结 合 的 blackfin 系列 
等 。ADI 的 blackfin 不 含 MMU， 完 整 支持 Linux, Æ MMU-less 情况 下 Linux 的 典型 案例 ， 其 
方 网 站 为 http://blackfin.uclinux.org/gf/， 目 前 blackfin 的 Linux 开发 保持 了 Linux mainline 的 同步 。 
通用 处 理 器 和 数字 信号 处 理 器 也 有 相互 融合 以 取长补短 的 趋势 ， 如 数字 信号 控制 器 (DSC) 
即 为 MCU+DSP，ADI 的 blackfin 系列 就 属于 DSC。 目 前 ， 蕊 片 厂 商 也 推出 了 许多 ARM+DSP 的 
双核 以 及 多 核 的 处 理 器 ， 如 TI 公司 的 OMAP 4 平台 就 包括 4 个 主要 处 理 引 擎 : ARM Cortex-A9 
MPCore、 PowerVR SGX 540 GPU (Graphic Processing Unit), C64x DSP 和 ISP (Image Signal 
Processor). 

除了 上 面 讲述 的 通用 微 控制 器 和 数字 信和 号 处 理 器 外 ， 还 有 一 些 针 对 特定 领域 而 设计 的 专用 处 
里 器 (ASP)， 它 们 都 是 针对 一 些 特定 应 用 而 设计 的 ， 如 用 于 HDTV. ADSL. Cable Modem 等 的 
专用 处 理 器 。 

网 络 处 理 器 是 一 种 可 编程 器 件 ， 它 应 用 于 电信 和 领域 的 各 种 任务 ， 如 包 处 理 、 协 议 分 析 、 路 | 


























































































































程序 


2.3 改进 的 哈佛 结构 
















































































































































































































































































o 
















































































































































































































































































































































































INUX 


驱动 设计 的 硬件 基础 e 


查找 、 声 音 /数据 的 汇聚 、 防 火 墙 、QoS 等 。 网 络 处 理 器 器 件 内 部 通常 由 若干 个 微 码 处 理 器 和 若干 
硬件 协 处 理 器 组 成 ， 多 个 微 码 处 理 器 在 网 络 处 理 器 内 部 并 行 处 理 ， 通 过 预先 编制 的 微 码 来 控制 处 
理 流程 。 而 对 于 一 些 复杂 的 标准 操作 (如 内 存 操 作 、 路 由 表 查 找 算法 、QoS 的 拥塞 控制 算法 、 流 
量 调度 算法 等 ) 则 采用 硬件 协 处 理 器 来 进一步 提高 处 理性 能 ， 从 而 实现 了 业务 灵活 性 和 高 性 能 的 
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对 于 某 些 应 用 场合 ， 使 用 ASIC (专用 集成 电路 〉 往往 是 低 成 本 且 高 性 能 的 方案 。ASIC 专 
而 设计 ， 不 具备 也 不 需要 灵活 的 编程 能 力 。 使 用 ASIC 完成 同样 的 功能 往往 比 
接 使 用 CPU 资源 或 CPLD (复杂 可 编程 逻辑 器 件 ) /FPGA【〔 现 场 可 编程 门 阵列 〉 来 得 更 廉价 
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在 实际 项 目的 硬件 方案 中 ， 往 往 会 根据 应 用 的 需求 选择 通用 处 理 器 、 数 字 信 号 处 理 器 、 特 定 
领域 处 理 器 、CPLD/FPGA 或 ASIC 之 一 的 解决 方案 ， 在 复杂 的 系统 中 ， 这 些 忌 片 可 能 会 同时 存在 ， 
协同 合作 ， 各 自发 挥 自己 的 长 处 。 如 在 一 款 智 能 手机 中 ， 可 使 用 MCU 处 理 图 形 用 户 界 面 和 用 户 
的 按键 输入 并 运行 多 任务 操作 系统 ， 使 用 DSP 进行 音 视频 编 解码 ， 而 在 射频 方面 则 采用 ASIC. 


综合 2.1 节 的 内 容 ， 我 们 可 得 出 如 图 2.4 所 示 的 处 理 器 分 类 



























































































































































































































































。 微 控制 器 (MCU，、 








又 称 单片机 ) 
通用 处 理 器 1 
CGPP) 
微 处 理 器 (MPU) | 融合， 数字 信号 
( 定点 DSP 控制 器 (DSC) 
接应 用 领域 分 类 | EET | 
(DSP) | 
` 浮 点 DSP 
( 网 络 处 
专用 处 理 器 [MAE 
CASP) 及。 音 视频 编 解码 器 
处 理 器 
汉 - 诺 伊 曼 结 构 
| 
哈佛 结构 
RISC 
nenaad 
CSIC 


24 ”处 理 器 分 类 


存储 器 


存储 器 主要 可 分 类 为 只 读 储存 器 CROMO. NE (Flash)、 随 机 存 取 存储 器 (RAM)、 光 、 
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磁 介 质 储存 器 。 

ROM 还 可 再 细 分 为 不 可 编程 ROM、 可 编程 ROM (PROM)、 可 擦 除 可 编程 ROM (EPROM) 
和 电 可 擦 除 可 编程 ROM (EEPROM), EEPROM 完全 可 以 用 软件 来 擦 写 ， 已 经 非常 方便 了 。 
目前 ROM 有 被 Flash 蔡 代 的 趋势 ， NOR CJE) NAND (与 非 ) 是 市 场 上 两 种 主要 的 Flash 
闪存 技术 。Intel 于 1988 年 首先 开发 出 NOR Flash 技术 , 彻底 改变 了 原先 由 EPROM 和 EEPROM 
一 统 天 下 的 局 面 。 紧 接着 ，1989 年 ， 东 芝 公 司 发 表 了 NAND Flash 结构 ， 每 比特 的 成 本 被 大 大 
降低 。 
NOR Flash 和 CPU 的 接口 属于 典型 的 类 SRAM 接口 (如 图 2.5 所 示 ), 不 需要 增加 额外 的 
控制 电路 。NOR Flash 的 特点 是 可 芯片 内 执行 (XIP, eXecute In Place)， 程 序 可 以 直接 在 NOR 
内 运行 。 而 NAND Flash 和 CPU 的 接口 必须 由 相应 的 控制 电路 进行 转换 ， 当 然 也 可 以 通过 地 
址 线 或 GPIO 产生 NAND Flash 接口 的 信号 。NAND FLASH 以 块 方式 进行 访问 ， 不 支持 芯片 
内 执行 。 



















































































































































































































































































| 数据 总 线 
"wa, 
— má | 
以 及 其 他 提供 SRAM 
接口 的 IO 芯片 等 
IE 


就 绪 / 忙 


中 断 ( 仅 对 VO 芯片 ) 








2.5 ”典型 的 类 SRAM 接口 














公共 闪存 接口 (Common Flash Interface， 简 称 CFI) 是 一 个 公开 的 、 标 准 的 从 NOR Flash 器 
件 中 读 取 数据 的 接口 。 它 可 以 使 系统 软件 查询 已 安装 的 Flash 器 件 的 各 种 参数 ， 包 括 器 件 阵列 结 
构 参 数 、 电 气 和 时 间 参 数 以 及 器 件 支持 的 功能 等 。 利 用 CFI， 在 不 修改 系统 软件 的 情况 下 ， 就 可 
以 用 新 型 的 和 改进 的 产品 代 蔡 旧版 本 的 产品 。 
一 个 NAND Flash 的 接口 主要 包含 如 下 信号 。 
LO iA: 地 址 、 指 令 和 数据 通过 这 组 总 线 传输 ， 一 般 为 8 位 或 16 位 。 
e ŠSK (Chip Enable，CE#): 如 果 没 有 检测 到 CE SS, MWA, NAND 器 件 就 保持 待 
机 模式 ， 不 对 任何 控制 信号 做 出 响应 。 
e 写 使 能 (Write Enable, WE#): WE# 负 责 将 数据 、 地 址 或 指令 写 入 NAND zm. 
e 读 使 能 (Read Enable, RE#): RE# 人 允许 数据 输出 。 
j 当 CLE 为 高 时 ， 在 WE# 信 号 的 上 升 沿 ， 
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间 令 将 被 锁 存 到 NAND 指令 寄存 器 中 。 
地 址 锁 存 使 能 (Address Latch Enable, ALE): 当 ALE 为 高 时 ， 在 WE# 信 号 的 上 升 沿 ， 
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地 址 将 被 锁 存 到 NAND 地 址 寄存 器 : 
就 绪 / 忙 CReady/Busy, R/B#): 如 果 


























上 拉 电 
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于 Flash 
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转 ， 
Flash 的 同时 ， 应 采 

Flash 的 编程 
对 应 的 块 擦 除 ， 而 擦 















































NAND Flash 较 NOR Flash 
而 NOR 的 擦 写 次 数 是 十 万 次 ;NAND Flash 的 


除 的 过 程 就 是 


阻 。 


Zi He 











的 电器 特性 ， 在 读 写 数据 过 程 j 
NAND Flash 发 生 位 反 转 的 几率 要 远大 于 NOR Flash。 位 反 转 无 法 避免 ， 
错误 探测 /错误 更 正 (EDC/ECC) 算法 。 
原理 都 是 只 能 将 1 写 为 0， 而 不 能 将 0 写 为 1。 所 以 在 Flash 编程 之 前 ， 
EMAS 1 的 过 程 ， 块 内 的 所 有 字 节 变 为 0xFF。 
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NAND 器 件 忙 ，R/B# 信 号 将 变 低 。 该 信号 是 漏 极 开 


























价格 低 ; NAND Flash ! 
擦 除 、 编 





















































Jk, IDE 接口 
Attachment?) 接口 








Ultra ATA/100 及 Serial ATA 的 发 
以 上 所 述 的 各 种 ROM、Flash 和 磁 介 质 存储 器 都 属于 非 易 失 性 存储 器 CNVM) 的 范畴 ， 











许多 先入 式 系统 都 提供 了 IDE (Integrated Drive Electronics) 接 
的 信号 与 SRAM 类 似 。 人 们 通常 也 把 IDE 接 
， 技 术 角度 而 言 并 不 准确 。 其 实 ，ATA 接 





展 过 程 。 






































RNR, 


每 个 块 的 最 大 擦 写 次 数 是 一 百 万 
程 速度 远 超过 NOR Flash. 
H, BREE 1 位 或 几 位 数据 





即位 反 

















因此 ， 使 





] NAND 














口 ， 以 供 连 接 硬盘 控 
口 称 为 ATA (Advanced Technology 














口 发 展 至 今 ， 己 经 经 

















言 息 不 会 丢失 ， 而 RAM 则 与 此 相反 。 

















RAM #4] 








分 为 静态 RAM (SRAM) 和 动态 RAM (DRAM). DRAM 以 电荷 




















数据 存储 在 电容 器 中 。 由 于 电容 器 会 



































昌 于 漏电 而 导致 电荷 丢失 ， 因 而 



































SRAM 是 静态 的 ， 
个 晶体 管 组 


通常 所 说 


只 要 供 











x 


























同步 的 时 钟 工 作 《〈 注 意 不 是 与 CPU 的 了 
的 上 升 沿 和 下 降 沿 传输 数据 ， 
] RSL (Rambus 发 信 电 了 











用 了 时 钟 脉冲 
倍 。 此 外 ， 还 存在 使 
RDRAM. 
































B WERE 
， 而 DRAM 存储 单元 由 1 个 
的 SDRAM、DDR SDRAM Eg T DRAM 的 范畴 ， 它 们 采用 与 CPU 外 存 控制 


[ 作 频 率 一 致 )。 与 SDRAM 相 比 ，DDR SDRAM 同时 利 








[m | 
个 值 ，SRAM 没有 刷新 周 


晶体 管 和 1 个 电容 器 组 成 。 















































因此 在 时 钟 频率 不 变 的 情况 下 ， 











针对 许多 特定 场合 的 应 用 ， 艇 入 式 系统 中 往往 还 使 








1. NVRAM: 非 易 失 性 RAM 
既然 是 RAM， 就 是 易 失 性 的 ， 为 什么 会 有 一 类 非 易 失 性 的 RAM WE? 





实际 上 ， 
的 信息 




















si 
AU o 


m 
H 











NVRAM 借助 带 有 备用 电源 的 SRAM 或 借助 NVM CA 
恢复 来 实现 。NVRAM 的 特点 是 完全 像 SRAM 一 样 读 写 ， 而 
失 ， 不 需要 EEPROM 和 Flash 的 特定 擦 除 和 编程 操作 。NVRAM ZH 





2. DPRAM: 双 端 口 RAM 








和 读 写 控制 线 ， 通 常用 于 2 个 











DPRAM 的 特点 是 可 以 通过 2 个 端 


处 理 吉 之 间 交 互 数 据 ， 如 


























DRAM 器 件 需要 定 
期 。 每 个 SRAM ffi 





必须 将 


b! d BG 


Bif ATA-1 (IDE), 
ATA-2 (EIDE Enhanced IDE/Fast ATA), ATA-3 (FastATA-2), Ultra ATA. Ultra ATA/33, Ultra ATA/66. 












































EIH 











3] 





被 刷新 。 














佬 单 元 
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数据 传输 频率 被 加 


用 了 一 些 特定 类 型 的 RAM。 





























F) 技术 的 RDRAM (Rambus DRAM) 和 Direct 


|| EEPROM) 存储 SRAM 
号 入 的 信息 掉 电 不 丢 









































口 同 时 访问 ， 具 有 2 


















































端 可 以 通过 轮 询 或 中 断 获 知 ， 
电路 集成 在 DPRAM 内 部 ， 因 











读 取 




















ESA 



































而 硬件 











工程 师 设计 电路 的 原理 比较 简单 。 




















存放 系统 


的 数据 。 由 于 双 CPU 同时 访问 DPRAM 时 的 





套 完全 独立 的 数据 总 线 、 地 址 总 线 线 
图 2.6 所 示 。 当 一 端 被 写 入 数据 后 ， 另 一 





中 裁 逻 辑 


eo 
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控制 总 线 控制 总 线 
控制 寄存 器 





2.6 XUL RAM 























DPRAM 的 优点 是 通信 速度 快 、 实 时 性 强 、 接 口 简 单 ， 而 且 两 边 CPU 都 可 主动 进行 数据 传输 。 
除了 双 端 口 RAM 以 外 ， 目 前 IDT 等 芯片 厂商 还 推出 了 多 端口 RAM， 可 以 供 3 个 以 上 的 CPU E. 

3. CAM: 内 容 寻 址 RAM 

CAM 是 以 内 容 进 行 寻 址 的 存储 器 ， 是 一 种 特殊 的 存储 阵列 RAM， 它 的 主要 工作 机 制 就 是 将 
一 个 输入 数据 项 与 存储 在 CAM 中 的 所 有 数据 项 自动 同时 进行 比较 ， 判 别 该 输入 数据 项 与 CAM 中 
存储 的 数据 项 是 否 相 匹配 ， 并 输出 该 数据 项 对 应 的 匹配 信息 。 

如 图 2.7 所 示 ， 在 CAM 中 ,输入 的 是 所 要 查询 的 数据 ， 输 出 的 是 数据 地 址 和 匹配 标志 。 若 
匹配 〈 即 搜寻 到 数据 )， 则 输出 数据 地 址 。CAM 用 于 数据 检索 的 优势 是 软件 无 法 比拟 的 ， 可 以 极 
大 地 提高 系统 性 能 。 


























































































































































































































2.7 CAM 的 输入 与 输出 

















e FIFO: 先进 先 

FIFO 存储 器 的 特点 是 先进 先 出 ， 进 出 有 序 ，FIFO 多 用 于 数据 缓冲 。FIFO 和 DPRAM 类 似 ， 
有 具 有 两 个 访问 端口 ， 但 是 FIFO 两 边 的 端口 并 不 对 等 ， 某 一 时 刻 只 能 被 设置 为 一 边 作为 输入 ， 一 
边 作为 输出 。 

如 果 FIFO 的 区 域 共 为 n 个 字 节 ， 我 们 只 能 通过 循环 n 次 读 取 同 一 个 地 址 才能 将 该 片区 域 读 
出 ， 不 能 指定 偏 移 地 址 。 对 于 有 n 个 数据 的 FIFO， 当 循环 读 取 m 次 ， 下 一 次 读 会 自动 读 取 到 第 m+1 
个 数据 ， 这 是 由 FIFO 本 身 的 特性 决定 的 。 

总 结 2.2 节 的 内 容 ， 我 们 可 得 出 如 图 2.8 所 示 的 存储 器 分 类 。 
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r ROM 
PROM 
ROM | EPROM 
EPROM 
NOR Flash 
非 易 失 性 存储 
器 (NVMD Flash 4 
* NAND Flash 
光 、 磁 介质 存储 器 
储存 器 
SRAM 
DRAM(SDRAM、DDR SDRAM 等 ) 
n PER 5 NVRAM 
特定 应 用 RAM DPRAM 
守 定 应 
一 般 采用 SRAM | CAM 
FIFO 
图 2.8 存储 器 分 类 
接口 与 总 线 
2.3.1 串口 
RS-232、RS-422 与 RS-485 都 是 串 行 数据 接口 标准 ， 最 初 都 是 由 电子 工业 协会 CEIAO 制订 
发 布 的 。 
RS-232 在 1962 年 发 布 ， 命 名 为 EIA-232-E。 之 后 发 布 的 RS-422 定义 了 一 种 平衡 通信 接口 ， 












































它 是 一 种 单机 发 送 、 多 机 接收 的 单 向 、 平 衡 传输 规范 ， 被 命名 为 TIA/EIA-422-A 标准 。RS-422 改 
进 了 RS-232 通信 距离 短 、 速 率 低 的 缺点 。 为 进一步 扩展 应 用 范围 ，EIA 又 于 1983 年 在 RS-422 
的 基础 上 制定 了 RS-485 标准 ， 增 加 了 多 点 、 双 向 通信 能 力 ， 即 允许 多 个 发 送 器 连接 到 同一 条 总 
线 上 ， 同 时 增加 了 发 送 器 的 驱动 能 力 和 冲突 保护 特性 ， 并 扩展 了 总 线 共 模 范围 ， 被 命名 为 
TIA/EIA-485-A 标准 。 

1969 年 发 布 的 RS-232 修改 版 RS-232C 是 谍 入 式 系统 应 用 最 广泛 的 串 行 接口 , 它 为 连接 DTE 
(数据 终端 设备 ) 与 DCE (数据 通信 设备 ) 而 制定 。RS-232C 规 标 准 接口 有 25 条 线 CA 条 数据 线 、 
11 条 控制 线 、3 条 定时 线 、7 条 备用 和 未 定义 线 )， 常 用 的 只 有 9 根 ， 它 们 是 RTSMCTS 〈 请 求 发 送 / 
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RTS/CTS, TxD/RxD, DRS/DTR 等 信号 的 定义 如 下 。 


























TxD: DTE 通过 TxD 将 串 行 数据 发 送 到 DCE. 




















© RTS: 用 来 表示 DTE 请 求 DCE 发 送 数据 ， 当 终端 
CTS: 用 来 表示 DCE 准备 好 接收 DTE 发 来 的 数据 ， 是 对 RTS 的 响应 信号 


青 除 发 送 流 控制 )、RxD/TxD (数据 收发 )、DSR/DTR (数据 终端 就 绪 / 数 据 设置 就 绪 流 控制 )、DCD 
(数据 载波 检测 ， 也 称 RLSD， 即 接收 线 信号 检 出 )、 Ringing-RI ( 振 铃 指示 )、SG (信和 号 地 ) 信号 








要 发 送 数 据 时 ， 使 该 信号 有 效 。 


























DSR: 有 效 (ON 状态 ) 表明 DCE 可 以 使 用 。 
DTR: 有 效 (ON 状态 ) 表明 DTE 可 以 使 用 。 
































准备 接收 ， 并 且 由 DCE 将 接收 到 的 载波 信号 解 调 


























通知 终端 ， 已 被 呼叫 。 










































































使 用 RS-232C 进行 对 等 通信 ， 如 Windows 超级 终端 、Linu 
最 简单 的 RS-232C 串口 只 

组 成 一 个 RS-232C Œ 
用 异步 接收 器 发 送 器 , 作用 是 完成 并 / 串 转换 )、CMOS/TTL 


或 自 定义 连接 器 。 
数据 总 线 






















































































RS-232C 信号 




















2.3.2 PC 






















































































收 的 设备 都 可 以 成 为 主 设备 。 主 控 能 够 控制 数据 的 传输 和 时 







































































和 SCL 线 都 保持 高 电 平 。 根 据 开 漏 输 出 或 集 电 极 开 路 输出 




















RxD: DTE 通过 RxD 接收 从 DCE 发 来 的 串 行 数据 。 


€  Ringing-RI: 当 MODEM 收 到 交换 台 送 来 的 振 铃 呼 


组 成 PC 总 线 的 两 个 信号 为 数据 线 SDA 和 时 钟 SCL。 为 了 避免 总 线 信 号 的 混乱 ， 要 求 各 设备 
连接 到 总 线 的 输出 端 必须 是 开 漏 输出 或 集 电 极 开路 输出 的 结构 。 总 线 空闲 时 ， 上 拉 电 阻 使 SDA 





DCD: 当 本 地 DCE 设备 收 到 对 方 DCE 设备 送 来 的 载波 信号 时 ， 使 DCD 有 效 ， 通 知 DTE 


为 数字 信号 ， 经 RXD 线 送 给 DTE。 
叫 信号 时 ， 使 该 信号 有 效 (ON 状态 )， 


























在 租 入 式 系统 中 ， 并 不 太 注 重 DTE 和 DCE 的 概念 ， 而 RS-232C 也 很 少 用 来 连接 modem, € 














x minicom 用 来 连接 电路 板 控制 台 等 。 


























需要 连接 RxD、TxD、SG 这 3 个 信号 ， 使 用 XON/XOFF 软件 流 控 。 
口 的 硬件 原理 如 图 2.9 所 示 , 从 CPU 到 连接 器 依次 为 : CPU、UART ( 通 
































EF RS-232C 电 平 转换 、DB9/DB25 








RS-232C 信号 


地 址 总 线 TTL/CMOS 
CPU DM UART K 与 RS-232C , 
Dr 
TTL/CMOS 电 平 转换 RS-232C 电 平 
控制 总 线 EF 





2.9 RS-232C 串口 电路 原理 


PC (内 置 集 成 电路 ) 总 线 是 由 Philips 公司 开发 的 两 线 式 串 行 总 线 ， 产 生 于 20 世纪 80 年 代 ， 
日 于 连接 微 控制 器 及 其 外 围 设备 。PC 总 线 简 单 而 有 效 ， 占 用 很 少 的 PCB 〈 印 刷 电路 板 ) 空间 ， 芯 
片 管 脚 数量 少 ， 设 计 成 本 低 。PC 总 线 支 持 多 主 控 C(multiemastering) 模式 ， 任 何 能 够 进行 发 送 和 接 





























钟 频率 ， 在 任意 时 刻 只 能 有 一 个 主 控 。 






































HH] "5" X8, PC 总 线 上 任意 
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器 件 输出 低 


Y 


PC 设备 上 
于 接收 总 线 上 




















路 

要 通过 SCL 
脉冲 
可 以 

















当 SCL 稳定 在 高 
生 一 个 停止 位 ， 如 





























“ 线 与 "逻辑 指 的 是 两 个 或 两 个 以 上 的 输出 直接 互 连 就 可 以 实现 “AND"” 的 逻辑 功能 
出 端 是 


外 平 都 会 使 相应 总 线 上 的 信号 线 变 低 。 





工程 师 一 般 以 “OC 门 " 简 称 开 漏 或 集 电极 开路 。 








输出 


品行 数 ， 

















电路 发 








BF; ENEKEN 
向 SCL RR H 




















SDA 


SCL 

















图 2.10 所 示 。 





开始 位 




















开始 位 和 停止 位 都 1 


备 在 发 起 传输 过 程 前 











HZ SDA 接口 
的 数据 。 同 样 地 ， 串 行 
































送 时钟 信 号 ， 











几 命 令 的 从 设备 需 按 总 线 | 
低 电 平 信号 以 延长 总 线 时 钟 信号 周 
EFF, SDA H 





图 2.10 











个 上 


kee 








E ee 


MSB 


2.39.8 USB 








rj 








USB ( 通 
主板 插 槽 和 端 
































口 之 间 的 矛盾 而 于 1995 FEH 


ETE 


电路 是 双向 的 ， 输 出 电路 | 
PZE SCL 也 是 双向 的 ， 
检测 总 线 上 SCL 上 的 电 平 以 决定 




















期 " 





高 到 低 的 变化 将 产生 一 个 开始 位 ， 而 由 低 到 高 


PC 总 线 开始 位 和 停止 位 


FC 主 设备 产生 。 在 选择 从 设备 时 ， 如 果 从 设备 采 ) 
和 ， 需 先 发 送 1 字 节 的 地 址 信息 ， 
之 后 ， 每 次 传输 的 数据 也 是 1 个 字 节 ， 从 MSB 位 开始 传输 。 每 
上 升 沿 到 来 之 前 ， 接 收 方 应 该 发 出 1 个 ACK 位 。SCL | 

















CO OC /i 





来 自 接收 方 的 ACK 
8 9 1 2 
ACK 
字 节 传输 完成 时 钟 线 保持 低 


图 2.11 lC 总 线 时 序 


串 行 总 线 ) 是 Intel. Microsoft 等 厂商 为 解 划 














HI, CRA GT 


E SCL 的 信号 发 送 或 接收 SDA 上 的 


前 7 位 为 设备 地 址 ， 
个 字 节 
上 的 时 钟 脉冲 
时 钟 周期 之 后 ， 主 控 方 应 该 释放 SDA，TC 总 线 的 时 序 如 图 2.11 所 示 。 


计算 机 外 设 种 类 的 日 
四 传输 率 高 、 易 扩 


驱动 设计 的 硬件 基础 


, REH 


漏 ( 对 于 CMOS 器 件 ) 输出 或 集 电 极 开路 ( 对 于 TTL 器 件 ) 输出 时 才 满 足 此 条 件 。 




















] 于 向 总 线 上 发 送 数据 ， 输 入 
作为 控制 总 线 数据 传送 的 主机 
十 么 时 候 发 下 一 个 时 钟 


























ry 








言 号 ， 它 也 
的 变化 则 产 


SDA 


SCL 





停止 位 

















]7 位 地 址 ， 则 主 设 
最 后 1 位 为 读 写 标 志 。 
EE, Æ SCL 的 第 9 个 
FC 主 控 方 发 出 ， 在 第 8 






































pacca 


来 自 接收 方 的 ACK 











益 增 加 与 有 限 的 
展 、 文 持 即 插 即 用 和 
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热 插 拔 的 优点 ， 目 前 已 得 到 广泛 应 用 
USB 1.1 包含 全 速 和 低速 两 种 模式 ， 低 速 方式 的 速率 为 1.5Mbit/s， 支 持 一 些 不 需要 很 大 数据 
否 吐 量 和 很 高 实时 性 的 设备 , 如 鼠标 等 。 全 速 模 式 为 12Mbit/s, 可 以 外 接 速率 更 高 的 外 设 ”在 USB 
2.0 中 ， 增 加 了 一 种 高 速 方式 ， 数 据 传输 率 达 到 480Mbit/s， 可 以 满足 更 高 速 外 设 的 需要 

USB 的 物理 拓扑 结构 如 图 2.12 所 示 ， 在 USB 2.0 中 ， 高 速 方式 下 Hub 使 全 速 和 低速 方式 的 
言 令 环境 独立 出 来 ， 图 2.13 所 示 高 速 方式 下 Hub 的 作用 






































































































































Root Hub 





2.12 USB 的 物理 拓扑 


USB 2.0 主机 控制 器 
全 /低速 设备 


全 /低速 传输 方式 














2.13 USB 2.0 连接 高 速 、 全 /低速 设备 

















在 嵌入 式 系统 中 ， 电 路 板 若 需要 挂 接 USB 设备 (device)， 则 需 提 供 USB 主机 Chost) 控制 
器 和 连接 器 ; 若 电 路 板 需要 作为 USB 设备 ， 则 需 提 供 USB 设备 适配器 和 连接 器 。 有 的 MCU 集 
成 了 USB 主机 控制 器 和 设备 适配器 。 

USB 总 线 的 机 械 连 接 非 常 简单 ， 采 用 4 蕊 的 屏蔽 线 ， 一 对 差分 线 (De, DO 传送 信号 ， 男 
一 对 (VBUS， 电 源 地 ) 传送 +5V 的 直流 电 。 一 个 USB 主 控制 器 端口 最 多 可 连接 127 个 器 件 ， 各 
器 件 之 间 的 距离 不 超过 5 米 

USB 提供 了 4 种 传输 方式 以 适应 各 种 设备 的 需要 ， 说 明 如 下 。 
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CD 控制 〈Control) 传输 方式 。 
空 制 传输 是 双向 传输 ， 数 据 量 通常 较 小 ， 主 要 用 来 进行 查询 、 配 置 和 给 USB 设备 发 送 通用 的 


AA 
命令 


eo 






































(2) E (Synchronization) 传输 方式 。 

同步 传输 提供 了 确定 的 带宽 和 间 隅 时 间 ， 它 被 用 于 时 间 严 格 并 具有 较 强 容错 性 的 流 数 据 传 输 ， 
或 者 用 于 要 求 恒定 的 数据 传送 率 的 即时 应 用 。 例 如 进行 语音 业务 传输 时 ， 使 用 同步 传输 方式 是 很 
好 的 选择 

(3) 中 断 〈Interrupt) 传输 方式 。 

中 断 方式 传送 是 单 向 的 ， 对 于 USB 主机 而 言 ， 只 有 输入 。 中 断 传输 方式 主要 用 于 定时 查询 设 
备 是 否 有 中 断 数 据 要 传送 ， 该 传输 方式 应 用 在 少量 的 、 分 散 的 、 不 可 预测 的 数据 传输 场合 ， 键 盘 、 
游戏 杆 和 鼠标 属于 这 一 类 型 

(4) 批量 (Bulk) 传输 方式 。 

批量 传输 主要 应 用 在 没有 带宽 和 间隔 时 间 要 求 的 批量 数据 的 传送 和 接收 ， 它 要 求 保 证 传输 
打印 机 和 扫描 仪 属 于 这 种 类 型 


2.3.4 ”以 太 网 接口 


以 太 网 接口 由 MAC (以 太 网 媒体 接 入 控制 器 ) 和 PHY (物理 接口 收发 器 ) 组 成 。 以 太 网 MAC 
由 IEEE-802.3 以 太 网 标准 定义 ， 实 现 了 数据 链 路 层 。 常 用 的 MAC XF 10Mbit/s 或 100Mbit/s 两 
种 速率 。PHY 则 实现 物理 层 功 能 ，IEEE-802.3 标准 定义 了 以 太 网 PHY， 它 符合 IEEE-802.3k 中 用 
于 10BaseT (第 14 条 ) 和 100BaseTX (第 24 条 和 第 25 条 ) 的 规范 。10BaseT 和 100BaseTX PHY 
两 种 实现 的 帧 格式 是 一 样 的 ， 但 信 令 机 制 不 同 ， 而 且 10BaseT 采用 曼彻斯特 编码 ，100BaseTX 采 
用 4B/5B 编码 。 
MAC 和 PHY 之 间 采 用 MIL 媒体 独立 接口 ) 连接 ， 它 是 IEEE-802.3 定义 的 以 太 网 行业 标准 ， 包 
括 1 个 数据 接口 和 1 个 MAC 和 PHY 之 间 的 管理 接口 。 数 据 接口 包括 分 别 用 于 发 送 和 接收 的 两 条 独 
立信 道 ， 每 条 信道 都 有 自己 的 数据 、 时 钟 和 控制 信号 ，MII 数据 接口 总 共 需 要 16 个 信号 。MII 管理 接 
口 包含 两 个 信号 ， 一 个 是 时 钟 信号 ， 男 一 个 是 数据 信号 。 通 过 管理 接口 ， 上 层 能 监视 和 控制 PHY 。 

组 成 一 个 以 太 网 接口 的 硬件 原理 如 图 2.14 所 示 ， 从 CPU 到 最 终 接口 依次 为 : CPU. MAC, 
PHY、 以 太 网 隔离 变压器 、RJ45 插座 。 以 太 网 隔离 变压器 是 以 太 网 收发 芯片 与 连接 器 之 间 的 磁性 
组 件 ， 在 其 两 者 之 间 起 着 信号 传输 、 阻 抗 匹配 、 波 形 修复 、 信 和 号 杂 波 抑制 和 高 电压 隔离 作用 。 
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2.14 ”以 太 网 接口 电路 原理 
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许多 处 理 器 内 部 集成 了 MAC 或 同时 集成 了 MAC 和 PHY， 另 有 许多 以 太 网 控 
Y MAC 和 PHY。 


2.3.5 ISA 


ISA【〔 工 业 标 准 结构 总 线 〉 总线 起 源 于 1981 年 IBM 生产 的 以 Intel 8088 为 CPU 的 IBM-PC 
微 计 算 机 ,开始 时 总 线 宽度 为 8 位 。1984 年 推出 的 IBM-PC/AT 系统 将 ISA 总 线 扩充 为 16 位 数据 
总 线 宽度 ， 同 时 地 址 总 线 宽度 也 由 20 位 扩充 到 了 24 位 。 其 后 推出 的 EISA (扩展 的 ISA) X 
32 位 地 址 线 ， 数 据 总 线 也 扩展 为 32 位 ， 但 仍 保持 了 与 ISA 的 兼容 。 

图 2.15 所 示 为 ISA PERT 这 些 信 号 可 分 为 3 组 。 

e 总线 基 本 信号 : ISA 总 线 工 作 所 需要 的 最 基本 信号 ， 含 复位 、 时 钟 、 电 源 、 地 等 。 
e 总 线 访问 信号 : 用 于 访问 ISA 总 线 设备 的 地 址 线 、 数 据 线 以 及 相应 的 应 答 信 号 
e 总线 控 制 信 号 : 中 断 和 DMA 请 求 。 





制 蕊 片 也 集成 
















































































































































































总 线 BACK 
基本 | OSC 
信号 L RESET 
SA s~ SA; SD; ~SD, T 
ELS IO CHRDY | 总 线 
A I/O CHCK& z 问 
AM AEN 48 
访问 | SMEMR# NOWS# 
信号 |  SMEMW# 
IOR# 
IOW# 
总 线 控 DACK;8 —DACK;&8 IRQ; ^7 IRQ; EN 总 线 控 
制 信号 T/C DRQ, ~DRQ, | 制 信号 
SA SD, SD, 
总 线 SBHE# MEMCS's# | 总 线 访 
访问 问 信号 
AR MEMR# IOCS16# 
信和 号 
MEME# 





总 线 控 DACK;8 —DACK;& IRQ;, IRQ DRQ 一 DRQ。 | 总 线 控 
制 信号 DACKo# DRQ; ~DRQ;, DRQ, EN 制 信号 


MASTER 


2.15 ISA 总 线 信号 




















图 2.15 中 各 信号 的 详细 定义 如 下 。 

€ RESET. BCLK: 复位 及 总 线 基本 时 钟 ，BLCK 为 83MHz。 
€ SAI9—SAO0: 存储 器 及 VO 空间 20 位 地 址 ， 带 锁 存 。 

€ LA23—LAIT7: 存储 器 及 IO 空间 20 位 地 址 ， 不 带 锁 存 。 
@ BALE: 总 线 地 址 锁 存 ， 外 部 锁 存 器 的 选 通 。 
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AEN: 地 址 允许 ， 表 明 CPU 让 出 





SBHE#: 高 字 节 人 允许， 打开 SD15 











NOWS#: 有 效 则 暗示 不 用 插入 等 
OCHCK#: ISA 卡 奇 偶 校 验 错 。 








DACK7#~DACK5#, DACK3#~ 
MASTER#: ISA 主 模块 确立 信号 
配合 使 ISA 卡 成 为 主 模块 。 


3.6 PCI cPCI 


PCI (外 围 部 件 互 连 ) 是 由 Intel F 199 
, 它 在 目前 
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FE] 
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总 线 操作 与 处 理 器 -存储 器 子 系统 操作 并 行 。 
总 线 时 钟 频 率 为 33MHz 或 66MHz， 最 高 传输 率 可 达 528MB/s. 
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E3 
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的 计算 机 系统 中 得 到 了 非常 广泛 的 应 用 。PCI 提供 了 一 组 完整 的 总 线 接口 规范 ， 其 


总 线 ，DMA 开始 。 


SMEMR#、SMEMW#: 8 位 ISA 存储 器 读 写 控制 。 
MEMR#、MEMW#: 16 位 ISA 存储 器 读 写 控制 。 
SDI5—SDO: 数据 总 线 ， 访 问 8 位 ISA 卡 时 高 8 位 自动 传送 到 SD7—SDO. 























一 SD8 数据 通路 。 








MEMCS16#、IOCS16#: ISA 卡 发 出 此 信号 确认 可 以 进行 16 位 传送 。 
IOCHRDY: ISA 卡 准 备 信号 ， 可 控制 插入 等 待 周 期。 








竺 周期 。 


IRQIS. IRQI4, IRQI2—IRQ9, IRQ7—IRQ3: 中 断 请 求 。 
DRQ7—DRQS. DRQ3-—DRQO: ISA F DMA 请 求 。 


DACK0#: DMA 请 求 响应 。 
, ISA 发 出 此 信号 ， 与 主机 内 DMAC (DMA 控制 器 ) 




















1 年 推出 的 一 种 局 部 总 线 ， 作 为 一 种 通用 的 总 线 接口 标 







































































的 是 描述 如 何 将 计算 机 系统 中 的 外 围 设 备 以 一 种 结构 化 和 可 控 化 的 方式 连接 在 一 起 ， 给 出 了 外 
设备 在 连接 时 的 电气 特性 和 行为 规约 ， 并 且 详 细 定 义 了 计算 机 系统 中 的 各 个 不 同 部 件 之 间 应 该 
何 正确 地 进行 交互 。PCI 总 线 具 有 如 下 特点 。 






























































@ 数据 总 线 32 位 ， 可 扩充 到 64 位 。 
e HITRE (burst) 模式 传输 。 
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式 总 线 仲裁 。 


















































现 即 插 即 用 
























































突 发 方式 传输 是 指 取得 总 线 控制 权 后 连续 进行 多 个 数据 的 传输 。 突 发 传输 时 ， 只 需要 给 
出 目的 地 的 首 地 址 , 访问 第 1 个 数据 后 , 第 2~n 个 数据 会 在 首 地 址 基础 上 按 一 定 规则 自动 被 
寻 址 和 传输 。 与 突 发 方式 对 应 的 是 单 周期 方式 ， 它 在 1 个 总 线 周期 只 传送 1 个 数据 。 


















































支持 全 自动 配置 、 资 源 分 配 ，PCI 卡 内 有 设备 信息 寄存 器 组 为 系统 提供 卡 的 信息 ， 可 实 
上 

















e PCI 总 线 规范 独立 于 微 处 理 器 ， 通 用 性 好 。 

















e PCI 设备 可 以 完全 作为 主 控 设 备 控制 总 线 。 















































图 2.16 给 出 了 一 个 典型 的 基于 PCI 总 线 的 计算 机 系统 逻辑 示意 图 ， 系统 的 各 个 部 分 
线 和 PCLPCI 桥 连接 在 一 起 。CPU 和 RAM 通过 PCI 桥 连接 到 PCI 总 线 0( 即 主 PCI 总 











通过 PCI 
E, m 





有 PCI 接口 的 显卡 则 可 以 直接 连接 到 主 PCI £k b. PCI-PCI 桥 是 一 个 特殊 的 PCI 设备 ， 它 负 




















ER) 连接 在 一 起 ， 通 常 PCI 总 线 1 称 为 PCI-PCI 桥 的 











将 PCI 总线 0 和 PCI 总 线 1 ( 即 从 PCI 3 





eo 
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的 ISA 总 





下 游 (downstream), ij PCI 总 线 0 则 称 为 PCI-PCI 桥 的 上 游 (upstream)。 为 了 兼容 | 
线 标准 ，PCI 总 线 还 可 以 通过 PCI-ISA 桥 来 连接 ISA 总 线 ， 从 而 支持 以 前 的 ISA 设备 。 




















PCI 总 线 0 __ PCI 总线 1 
上 游 下 游 


(—  —3 





多 功能 VO 控制 器 
2.16 基于 PCI 总 线 的 计算 机 系统 























当 PCI 卡 刚 加 电 时 ， 卡 上 只 有 配置 空间 是 可 被 访问 的 ， 因 而 PCI 卡 开始 不 能 由 驱动 或 用 户 程 
序 访问 ， 这 与 ISA 卡 有 本 质 的 区 别 〈CPU 可 直接 读 取 ISA 卡 在 存储 空间 或 IO 空间 映射 的 地 址 )。 
PCI 配置 空间 保存 着 该 卡 工 作 所 需 的 所 有 信息 ， 如 厂家 、 卡 功能 、 资 源 要 求 、 处 理 能 力 、 功 能 模 
块 数量 、 主 控 卡 能 力 等 。 通 过 对 这 个 空间 信息 的 读 取 与 编程 ， 可 完成 对 PCI 卡 的 配置 。 如 图 2.17 
所 示 ，PCI 配置 空间 共 为 256 字 节 ， 主 要 包括 如 下 信息 。 

e 制造 商标 识 (Vendor ID ): H PCI 组 织 分 配给 厂家 。 

@ 设备 标识 (Device ID): 按 产品 分 类 给 本 卡 的 编号 。 

e 分 类 码 (Class Code): 本 卡 功能 的 分 类 码 ， 如 图 卡 、 显 示 卡 、 解 压 卡 等 。 

e 申请 存储 器 空间 : PCI 卡 内 有 存储 器 或 以 存储 器 编 址 的 寄存 器 和 LO 空间 ， 为 使 驱动 程 

序 和 应 用 程序 能 访问 它们 ， 需 申请 CPU 的 一 段 存 储 区 域 以 进行 定位 。 配 置 空间 的 基地 址 

寄存 器 用 于 此 目的 。 

申请 IO 空间 : 配置 空间 的 基地 址 寄存 器 也 用 来 进行 系统 IO 空间 的 申请 。 

e 中 断 资源 申请 : 配置 空间 中 的 中 断 引 脚 和 中 断 线 用 来 向 系统 申请 中 断 资源 。 中 断 资源 的 

申请 通过 中 断 引 脚 Cinterrupt pin) 和 中 断 线 Cinterrupt line) 来 完成 的 。 偏 移 3Dh 处 为 中 
断 引 脚 寄存 器 ， 其 值 表 明 PCI 设备 使 用 了 哪 一 个 中 断 引 脚 ， 对 应 关系 为 : 1-INTAZ. 
2-INTB#、3-INTC#、4-INTD#。 

PCI 总 线 上 的 信号 大 体 可 分 为 如 下 几 组 。 

系统 接口 信号 。 

地 址 与 数据 接口 信号 。 

接口 控制 

仲裁 信号 。 

错误 报告 

中 断 接 口 

其 他 接口 
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3l 16 
RH 


15 0 


修正 标志 





基地 址 寄存 器 


卡 总 线 CIS 指针 


子 系统 制造 商标 识 


扩展 ROM 基地 址 


2.47 PCI 配置 空间 


2.18 所 示 ， 这 些 信号 的 详细 定义 如 下 。 
CLK: 系统 时 钟 。 
AD31-—ADO: 地 址 和 数据 复 用 信号 线 信号 。 
C/BE3—C/BE: 总 线 命 令 和 地 址 使 能 信号 。 

PAR: 奇偶 校 验 信号 。 

FRAM E#: 帧 周期 信号 ， 指 示 总 线 操作 起 始 和 终止 。 
IRDY#: 主 设备 准备 好 信号 。 

TRDY#: 目标 设备 准备 好 信号 。 

STOP#: 目标 设备 要 求 终止 当前 数据 传输 信号 。 
DEVSEL #: 目标 设备 选中 信和 号。 

IDSEL: 配置 空间 读 写 时 的 片 选 信号 。 

LOCK#: 总 线 锁定 信号 。 

RST#: 复位 信和 号。 

INTA#、INTB#、INTC# 和 INTD#: 中断 请 求 。 
REQ#、GNT#: PCI 总 线 请 求 与 仲裁 后 的 授权 。 
AD63-AD32、C/BE7-4 等 : 作用 于 64 位 扩展 的 PCI 总 线 。 
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一 AD31~AD0 AD63—AD32 | 
地 址 和 iu 
数据 | ^ C/BEH3—BEHO OBERT = BERA 
64 位 扩充 
-一 PAR PAR64 
FRAMEH REQ64# 
IRDY# PCIE ACK64# 一 
IRTYH 
接口 控制 
STOP# LOCK# | 接口 控制 
DEVSEL# INTAR 
IDSEL — 
INTCH T 
PERR# 
出 错 | ^ SERRE INTD# 
REQH 
仲裁 TDI 
GNTH TDO 
TCK JTAG 
CLK TMS 
系统 | TRST& 
RSTH 
图 2.18 PCI 总 线 信号 
cPCI (Compact PCI, A! PCI) 是 以 PCI 电气 规范 为 标准 的 高 性 能 工业 





























VME (Visa Module Eurocard, p3) 
的 经 济 















































总 线 ， 结 合 了 
] 卡 模块 欧洲 卡 〉 的 高 性 能 、 可 扩展 性 和 可 靠 性 与 PCI 标准 
效 和 灵活 性 。cPCI 的 CPU 及 外 设 与 标准 PCI 是 相同 的 ， 使 用 与 传统 PCI 相同 的 芯片 和 














软件 ， 操 作 系统 、 驱 动 和 应 用 程序 都 感觉 不 到 两 者 的 区 别 。 图 2.19 
卡 、 背 板 和 机 箱 ， 基 本 上 都 是 “大 块头 ” 应 用 于 









































展示 了 与 cPCI 总 线 相关 的 板 
业 控制 和 大 型 通信 设备 。 





2.19 cPCI 板 卡 、 背 板 与 机 箱 


CPLD 和 FPGA 

















CPLD (复杂 可 编程 逻辑 器 件 ) 由 完全 可 编程 的 与 或 门 阵 列 以 及 宏和 


元 构成 。 






































CPLD 中 基本 逻辑 单元 是 宏 单 元 ， 宏 单元 由 











些 “ 与 或 ”阵列 加 上 触发 器 构成 ， 其 ， 














€€ 与 或 » 
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阵列 完成 组 合 逻辑 功能 ， 触 发 器 完成 时 序 逻 辑 。 宏 单元 中 与 阵列 的 输出 称 为 乘积 项 ， 其 数量 标志 
T CPLD 的 容量 。 乘 积 项 阵列 实际 上 就 是 一 个 “与 或 ”阵列 ， 每 一 个 交叉 点 都 是 一 个 可 编程 炊 丝 ， 
如 果 导 通 就 是 实现 “与 ”逻辑 。 在 “与 ”阵列 后 一 般 还 有 一 个 “或 ”阵列 ， 用 以 完成 最 小 逻辑 表 
达 式 中 的 “或 ”关系 。 图 2.20 所 示 为 非常 典型 的 CPLD 的 单个 宏 单 元 的 结构 。 


p 来 自 PIA 的 信号 











地 























































































































全 局 清 零 ”全 局 时 钟 








来 自 IO 引 肢 


快速 输入 选择 
寄存 器 





逻辑 阵列 通 往 PIA 
2.20 ”典型 的 CPLD 宏 单元 


图 2.21 给 出 了 一 个 典型 CPLD 的 整体 结构 。 这 个 CPLD 由 LAB (逻辑 阵列 模块 ， 由 多 个 
单元 组 成 ) 通过 PIA〔 可 编程 互 连 阵列 ) 互 连 
组 成 ， 而 CPLD 与 外 部 的 接口 则 由 IO 控制 模 
块 提供 。 
图 中 宏 单 元 的 输出 会 经 IO 控制 块 送 至 
LO 引 脚 ，LO 控制 块 控制 每 一 个 IO 引 脚 的 工 
作 模 式 ， 决 定 其 为 输入 、 输 出 还 是 双向 引 脚 ， 
决定 其 三 态 输 出 的 使 能 端 控制 。 
与 CPLD 不 同 ，FPGA〔 现 场 可 编程 门 阵 
列 ) 基于 LUT (ERK) 工艺 。 查 找 表 本 质 上 
是 一 片 RAM， 当 用 户 通过 原理 图 或 HDL Ch 
件 描述 语言 ) 语言 描述 了 一 个 逻辑 电路 以 后 ， 
FPGA 开发 软件 会 自动 计算 逻辑 电路 的 所 有 可 
能 的 结果 ， 并 把 结果 事先 写 入 RAM。 这 样 ， 
输入 一 组 信号 进行 逻辑 运算 就 等 于 输入 一 个 地 
址 进行 查 表 输 出 对 应 地 址 的 内 容 。 图 2.21 典型 CPLD 的 结构 
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图 2.22 所 示 为 一 个 典型 的 FPGA 的 内 部 结构 。 这 个 FPGA 由 IOC (输入 /输出 控制 模块 )、EAB 
嵌入 式 阵 列 块 )、LAB 和 FAST TRACK (快速 通道 互 连 ) 构成 。 
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图 2.22 典型 FPGA 的 结构 
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IOC 是 内 部 信号 到 IO 引 脚 的 接口 ， 它 位 于 FAST TRACK 的 行 和 列 的 末端 ， 每 个 IOC 包含 一 
个 双向 IO 缓冲 器 和 一 个 既 可 做 输入 寄存 器 也 可 做 输出 寄存 器 的 触发 器 。 

EAB (RART) 是 一 种 输入 输出 端 带 有 寄存 器 的 非常 灵活 的 RAM。EAB 不 仅 可 以 用 
作 存 储 器 ， 也 可 以 事先 被 写 入 查 表 值 来 以 用 来 构成 如 乘法 器 、 纠 错 逻 辑 等 电路 。 当 用 于 RAM 时 ， 
EAB 可 配制 成 8 位 、4 位、2 位 和 1 位 长 度 的 数据 格式 。 

LAB 主要 用 于 逻辑 电路 设计 , 一 个 LAB 包括 多 个 LE (逻辑 单元 ), 每 个 LE 包括 组 合 逻 辑 及 

个 可 编程 触发 器 。 一 系列 LAB 构成 的 逻辑 阵列 用 来 实现 普通 逻辑 功能 ， 如 计数 器 、 加 法 器 、 状 

态 机 等 。 

器 件 内 部 信号 的 互 连 和 器 件 引 出 端 之 间 的 信号 互 连 由 FAST TRACK 连 线 提供 ，FAST TRACK 
遍布 于 整个 FPGA 器 件 ， 是 一 系列 水 平和 垂直 走向 的 连续 式 布线 通道 。 

K 2.1 所 示 为 一 个 4 输入 LUT 的 实际 逻辑 电路 与 LUT 实现 方式 的 对 应 关系 。 


表 2.1 实际 逻辑 电路 与 查找 表 的 实现 
实际 逻辑 电路 LUT 的 实现 方式 
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续 表 

a, b, c, d 输入 逻辑 输出 地 xn RAM 中 存储 的 内 容 
0000 0 0000 0 
0001 0 0001 0 
0 E 0 





1111 1 1111 1 

















CPLD 和 FPGA 的 主要 厂商 有 Altera. Xilinx 和 Lattice 等 ， 采 用 专门 的 开发 流程 ， 在 设计 阶 
段 使 用 HDL 语言 (如 VHDL、Verilog HDL) 编程 。 它 们 可 以 实现 许多 复杂 的 功能 ， 如 实现 UART, 
IC 等 yo 控制 芯片 、 通 信 算法 、 音 视频 编 解 码 算法 等 ， 甚 至 还 可 以 直接 集成 ARM 等 CPU 核 和 
外 围 电 路 。 

对 于 驱动 工程 师 而 言 ， 我 们 只 需要 这 样 看 待 CPLD 和 FPGA: 如 果 它 完成 的 是 特定 的 接口 和 
空 制 功能 ， 我 们 就 直接 把 它 当成 由 很 多 逻辑 门 〈 与 、 非 、 或 、D 触发 器 ) 组 成 的 完成 一 系列 时 序 
逻辑 和 组 合 逻 辑 的 ASIC; 如 果 它 完成 的 是 CPU 的 功能 ， 我 们 就 直接 把 它 当 成 CU。 驱动 工程 师 
眼 里 的 硬件 比 IC 设计 师 要 宏观 。 


原理 图 分 析 


2.5.1 原理 图 分 析 的 内 容 

原理 图 分 析 的 含义 是 指 通过 阅读 电路 板 的 原理 图 获得 各 种 存储 器 、 外 设 所 使 用 的 硬件 资源 ， 
主要 包括 存储 器 和 外 设 控制 芯片 所 使 用 的 片 选 、 中 断 和 DMA 资源 。 通 过 分 析 片 选 得 出 芯片 的 内 
f£. VO 基地 址 ， 通 过 分 析 中 断 、DMA 信号 获得 芯片 使 用 的 中 断 号 和 DMA 通道 ， 并 归纳 出 如 表 
































































































































































































































































































































































































































































































































2.2 所 示 的 表格 
表 2.2 存储 器 、 外 设 控制 器 资源 占用 表 
wo K 片 Ë Æ 地 nr 字 长 大 小 中 断 号 DMA 通道 
DDR SDRAM Xml_CS1 0xC0000000 32 128MB 
0x18000000 
以 太 网 控制 器 CS1 16 4bytes 
0x18000004 


























上 述 表 格 对 驱动 开发 的 意义 很 重大 ， 实 际 上 ， 在 大 多 数 情 况 下 ， 硬 件 工程 师 已 经 给 驱动 工程 
师 提 供 了 这 个 表格 。 


2.5.2 原理 图 的 分 析 方 法 
原理 图 的 分 析 方 法 是 以 CPU 为 中 心 向 存储 器 和 外 设 辐射 ， 步 又 如 下 。 
(1) 阅读 CPU 部 分 ， 获 知 CPU 的 哪些 片 选 、 中 断 和 集成 的 外 设 控制 器 被 使 用 ， 列 出 这 些 元 
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CPU 引 脚 比较 多 的 时 候 ， 蕊 片 可 能 会 被 分 成 几 个 模块 单独 被 画 在 原理 图 的 不 同 页 上 ， 这 时 候 
应 该 把 相应 的 部 分 都 分 析 到 位 。 

(2) 对 第 一 步 中 列 出 的 元 素 从 原理 图 
硬件 原理 图 中 包含 如 下 元 素 。 
© 符号 (symbol). 
symbol 描述 芯片 的 外 围 引 脚 以 及 引 脚 的 信号 ， 对 于 复杂 的 芯片 ， 可 能 被 分 割 为 几 个 symbol. 


在 symbol 中 ,一 般 把 属于 同一 个 信号 群 的 引 脚 排列 在 一 起 。 图 2.23 所 示 为 NOR Flash AM29LV160DB 
和 NAND Flash K9F2G08 的 symbol。 
















































































对 应 的 外 设 和 存储 器 电路 
































分 析出 实际 的 使 用 情况 。 


















































I 









































AM29LV160DB K9F2G08 
TSOP48 TSOP48 


2.23 ”原理 图 中 的 symbol 


e 网 络 (net). 

描述 芯片 、 接 插件 和 分 离 元 器 件 引 脚 之 间 的 互 连 关 系 ， 每 个 网 络 需要 根据 信号 的 定义 赋 了 
个 合适 的 名 字 ， 如 果 没 有 给 网 络 取 名 字 ，EDA 软件 会 自动 添加 一 个 默认 的 网 络 名 。 添 加 网 络 后 的 
AM29LV160DB 如 图 2.24 所 示 。 

e HR 
原理 图 中 会 添加 一 些 文字 来 辅助 描述 原理 图 〈 类 似 源 代码 中 的 注释 )， 如 每 页 页 脚 会 有 该 页 的 
功能 描述 ， 对 重要 的 信号 ， 在 原理 图 的 相应 symbol 和 net 也 会 附带 文字 说 明 。 图 2.25 中 给 出 了 原 
里 图 中 描述 的 例子 。 
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nCE 
nOE 
nWE 
nRY/BY 
nRESET 
nBYTE 


ü 


VDD 





AM29LV160DB 
TSOP48 


2.24 ”原理 图 中 的 net 


LDD6410 Evaluation Board Schematics 





Revision Data Description 





Vi 2009. 12. 26 














2.25 ”原理 图 中 的 描述 


硬件 时 序 分 析 


2.6.1 时 序 分 析 的 概念 
驱动 工程 师 一 般 不 需要 分 析 硬件 的 时 序 ， 但 是 鉴于 许多 企业 内 驱动 工程 师 还 需要 承担 电路 板 
调试 的 任务 ， 因 此 ， 掌 握 时 序 分 析 的 方法 也 就 比较 必要 了 。 

对 驱动 工程 师 或 硬件 工程 师 而 言 ， 时 序 分 析 的 意思 是 让 芯片 之 间 的 访问 满足 芯片 手 
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册 中 时 序 
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图 信号 有 效 的 先后 顺序 、 采 样 建立 时 间 (setup time) 和 保持 时 间 Chold time). 的 要 求 ， 在 电路 板 
工作 不 正常 的 时 候 ， 准 确 地 定位 时 序 方面 的 问题 。 
建立 时 间 是 指 在 触发 器 的 时 钟 信号 边沿 到 来 以 前 ， 数 据 已 经 保持 稳定 不 变 的 时 间 ， 如 果 建 立 
时 间 不 够 ， 数 据 将 不 能 在 这 个 时 钟 边 沿 被 打 入 触发 器 ， 保 持 时 间 是 指 在 触发 器 的 时 钟 信号 边沿 到 
以 后 ， 数 据 还 需 稳定 不 变 的 时 间 ， 如 果 保 持 时 间 不 够 ， 数 据 同样 不 能 被 打 入 触发 器 。 如 图 2.26 

， 数 据 稳定 传输 必须 满足 建立 和 保持 时 间 的 要 求 ， 当 然 在 一 些 情况 下 ， 建 立时 间 和 保持 时 间 


f s DOSE. 


Loc owes s 
建立 时 间 ”保持 时 间 


2.26 ”建立 时 间 和 保持 时 间 






























































































































































在 工具 方面 ，SynaptiCAD 公司 的 Timing Diagrammer Pro 是 一 种 非常 好 的 数字 /模拟 时 序 图 编 
辑 器 及 分 析 引 警 。 


2.6.2 ”典型 硬件 时 序 

最 典型 的 硬件 时 序 是 SRAM 的 读 写 时 序 ， 在 读 / 写 过 程 中 涉及 的 信号 包括 地 址 、 数 据 、 片 选 、 
读 / 写 、 字 节 使 能 和 就 绪 / 忙 。 对 于 一 个 16 位 、32 位 (甚至 64 位 ) 的 SRAM， 字 节 使 能 表明 哪些 
字 节 被 读 写 。 
图 2.27 给 出 了 SRAM 的 一 个 读 时 序 ， 写 时 序 与 此 相似 。 首 乡 
址 ， 然 后 SRAM 片 选 被 发 出 ， 接 着 读 / 写 信号 被 输出 ， 之 后 读 写 信号 要 经 历数 个 等 待 周期 。 当 SRAM 
读 写 速度 比较 慢 时 , 等 待 周 可 以 由 MCU 的 相应 寄存 器 设置 , 也 可 以 通过 设备 就 绪 / 忙 (如 图 2.27 
中 的 nWait) 向 CPU 报告 ， 这 样 ， 读 写 过 程 中 会 自动 添加 等 待 周期 。 







































































是 地 址 总 线 上 输出 要 读 写 的 地 
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2.27 SRAM 读 时 序 图 



































NOR Flash 和 许多 外 设 控制 芯片 都 使 用 了 类 似 SRAM 的 访问 时 序 ， 因此， 牢固 掌握 这 个 时 序 
意义 重大 。 一 般 ， 在 艺 片 数据 手册 给 出 的 时 序 图 中 ， 会 给 出 图 中 各 段 时 间 的 含义 和 要 求 ， 真 实 的 
电路 板 必须 满足 世上 请 手册 上 描述 的 建立 时 间 和 保持 时 间 的 最 小 要 求 。 
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2. 心 片 手册 阅读 方法 
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必 片 手册 往往 长 达 数 百 页 甚至 上 干 页 ， 而 且 全 部 是 英文 ， 从 头 到 尾 不 加 区 分 地 阅读 需要 














花费 非常 长 的 时 间 ， 而 且 不 一 定 能 获取 对 设计 设备 驱动 有 帮助 的 信息 。 芯 片 手册 的 正确 阅读 






































方法 是 快速 而 准确 地 定位 有 用 信息 ， 重 点 阅读 这 些 信 息 ， 忽 略 无 关内 容 。 下 面 以 S3C6410A 
的 datasheet 为 例 来 分 析 阅 读 方法 ， 为 了 直观 地 反映 阅读 过 程 ， 本 节 的 图 都 直接 从 手册 中 抓 屏 





而 得 。 


打开 S3C6410 A 的 datasheet， 发 现 页 数 为 1378 页 ， 阅 读 这 样 





完成 整个 驱动 的 设计 工作 了 。 
S3C6410A datasheet 的 第 1 Æ “PRODUCT OVERVIEW” 即 “ 




















的 数据 手册 所 花费 的 时 间 足 够 














产品 综述 ”是 必 读 的 ， 通 过 阅 


读 这 一 部 分 可 以 获知 整个 芯片 的 组 成 。 这 一 章 往 往 会 给 出 一 个 芯片 的 整体 结构 图 ， 并 对 芯片 内 的 





主要 模块 进行 一 个 简洁 的 描述 。 如 图 2.28 所 示 ，S3C6410A 的 整体 


1.2 FEATURES 








结构 图 在 第 61 页 出 现 。 





This section summarizes the features of the S3C64 10X. Figure 1-1 is an overall block diagram of the S3C6410X. 
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2.28 S3C6410A datasheet 中 芯片 结构 图 
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中 直接 抓 H 
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第 2 一 43 章 每 一 章 都 对 应 S3C6410A 整体 结构 图 : 
的 S3C6410A datasheet 目录 结构 图 。 
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2.29  S3C6410A datasheet 目录 结构 





第 2 章 “MemoryMap” 即 “内 存 映 射 ”比较 关键 ， 对 于 定位 存储 器 和 外 设 所 对 应 的 基地 址 有 

















直接 指导 意义 ， 这 











S3C 


部 分 应 该 细 看 。 








第 3 一 34 章 对 应 于 CPU 内 部 集成 的 外 设 或 总 线 探 外 











详细 阅读 ， 主 要 是 要 分 析 数 据 、 控 和 
央 和 具体 设备 的 操作 流程 〈datasheet 中 会 给 出 步 又 ， 
6410A 的 PC 控制 器 驱动 ， 我 们 需要 详细 阅读 类 似 图 2.30 的 寄存 器 定义 表格 和 图 
作 流 程 图 。 


第 44 章 “ELECTRICAL DATA” 即 “电气 数据 ”描述 芯片 的 电气 特 怕 


Ber. D PETRI BE 






































种 工作 模式 下 的 时 序 及 于 
对 于 硬件 
件 了 








的 还 会 给 























tH 流程 图 


口 的 驱动 时 ， 应 


出 、 地 址 寄存 器 (datasheet 中 一 般 会 以 表格 列 出 ) 的 访问 


譬如 为 了 编写 





[ 程 师 并 不 需 阅读 。 









































划 述 芯片 的 物理 特性 、 尺 寸 和 封装 ， 硬 
时 装 〈footprint)， 但 是 ， 驱 动工 程 师 无 需 阅 读 。 








2.31 的 操 


E， 如 电压 、 电 流 和 各 
二 立时 间 和 保持 时 间 的 要 求 。 所 有 的 datasheet 都 会 包含 类 似 章 节 ， 这 一 章 
程 师 比 较 关 键 ， 但 是 ， 一 般 来 说 ， 驱 动 了 
第 45 章 “MECHANICAL DATA” 即 “机 械 数 据 ”， 
[ 程 师 会 依据 这 一 章 绘 制 芯片 的 
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30.11.1 MULTI-MASTER IIC-B US CONTROL (IICCON) REGISTER 


驱动 设 i 





Register 


Address RW 


Description 


Reset Value 





0x7F004000 RW 


IIC Channel 0 Bus control register 


0x0X 





IICCON 





0x7FOO0F000 RAW 





IIC Channel 1 Bus control register 


0x0X 








IICCON 


Bit Description 


Initial State 





Acknowledge generation 
(1) 


7 IIC-bus acknowledge (ACK) enable bit. 
0: Disable 
1: Enable 


In Tx mode, the IICSDA is free in the ACK time. 
In Rx mode, the IICSDA is L in the ACK time. 


0 





Tx clock source selection 


6 Source clock of IIC-bus transmit clock prescaler 
selection bit 

0: IICCLK = PCLK /16 

1: IICCLK = PCLK /512 





Tx/Rx Interrupt (5) 


5 IIC-Bus Tx/Rx interrupt enable/disable bit. 
0:Disable, 1:Enable 





Interrupt pending flag (2) 
(3) 








written to 1. When this bit is read as 1, the IICSCL is 
tied to L and the IIC is stopped. To resume the 
operation, clear this bit as 0 


0: 1) No interrupt pending (when read). 
2) Clear pending condition & 
Resume the operation (when write). 
1: 1) Interrupt is pending (when read) 
2) N/A (when write) 


4 IIC-bus Tx/Rx interrupt pending flag. This bit cannot be 





Transmit clock value (4) 





2.30 





[3:0] |!IC-Bus transmit clock prescaler. 


4-bit prescaler value, according to the following 
formula: 
Tx clock = IICCLK/(I1TCCCON[3:0] 1). 





芯片 手册 中 以 表格 形式 列 出 寄存 器 定义 


30.10 FLOWCHARTS OF OPERATIONS IN EACH MODE 


The following steps must be executed before any IIC Tx/Rx operations 


1. Write own e add 
2. SetlICCON register 





a) Enable interrupts 


b) Define SCL period 





n IICADD register, if needed. 


3. SetIICSTAT to enable Serial Output 


IIC-Bus transmit clock frequency is determined by this 





Undefined 














START ) 
J 

















Master Tx mode has 
been configured 


Write slave addr 
IICDS 





Write OxFO (WT 
Start) to IICSTAT 


The data of the IICDS is 
transmitted 


ACK period and ther 
nterrupt is pending. 












Write new data 
transmitted to IICDS 


Write OxDO (M/T 
Stop) to IICSTAT 








Clear pending bit 





+ 


Wait until the stop 
condition takes effect 





The data of the IICDS is 
shifted to SDA 











2.31 


芯片 手册 中 给 出 外 设 控 制 器 的 操作 流程 





的 硬件 基础 
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2.8.81 JAR 
在 电路 板 调试 过 程 中 我 们 主要 使 用 万 用 表 的 两 个 功能 
e 测量 电 平 。 
e 使 用 二 极 管 挡 测 量 电路 板 上 网 络 的 连通 性 ， 当 示波器 被 设置 在 二 极 管 挡 ， 测 量 连通 的 网 































































































络 会 发 出 “ 滴 滴 ” 的 鸣叫 ， 否 则 ， 没 有 连通 


2.8.2 ”示波器 


示波器 是 利用 电子 示 波 管 的 特性 ， 将 人 眼 无 法 直接 观测 的 交 变 电信 号 转换 成 图 像 ， 显 示 在 荧 
光 屏 上 以 便 测量 的 电子 仪器 。 它 是 观察 数字 电路 实验 现象 、 分 析 实 验 中 的 问题 、 测 量 实验 结果 必 
不 可 少 的 重要 仪器 。 
使 用 示波器 主要 应 注意 调节 垂直 偏转 因数 选择 CVOLTS/DIVO 和 微调 、 时 基 选 择 CTIME/DIV) 
和 微调 以 及 触发 方式 。 
如 果 VOLTS/DIV 设置 不 合理 , 则 可 能 造成 电压 幅度 超出 整个 屏幕 或 在 屏幕 上 变动 太 过 微 
小 无 法 观测 的 现象 。 图 2.32 所 示 为 同一 个 波形 在 VOLTS/DIV 设置 由 大 到 小 变化 过 程 中 的 示 
意图 。 

如 果 TIME/DIV 设置 不 合适 ， 则 可 能 造成 波形 混 迭 。 混 迭 意 味 着 屏幕 上 显示 的 波形 频率 低 于 
信号 的 实际 频率 。 这 时 候 ， 可 以 通过 慢 慢 改变 扫 速 TIME/DIV 到 较 快 的 时 基 挡 ， 如 果 波 形 的 频率 
参数 急剧 改变 或 者 晃动 的 波形 在 某 个 较 快 的 时 基 挡 稳定 下 来 ， 说 明之 前 发 生 了 波形 混 迄 。 根 据 奈 
奎 斯 特定 理 ， 采 样 速率 至 少 高 于 信号 高 频 成 分 的 2 倍 才 不 会 发 生 混 欠 ， 如 一 个 500MHz 的 信号 ， 






















































































































































































































































































































































































































































































.00 
0.000 40.00 80.00 120.00 160.00 200.00 
Time (ns) 


(a) S0V/DIV 
2.32 示波器 的 VOLTS/DIV 设置 与 波形 
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eo 
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Voltage -V— 
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(b) 10V/DIV 
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2.32 ”示波器 的 VOLTS/DIV 设置 与 波形 ( 续 ) 














Voltage - V- 







































































至 少 需要 1GS/s 的 采样 速率 。 图 2.33 所 示 为 同一 个 波形 在 TIME/DIV 设置 由 小 到 大 变化 过 程 中 的 
示意 图 


So 








fsmax>2fiwax 时 ,采样 之 后 的 数字 信号 可 完整 地 保留 了 原始 信息 。 这 条 定理 在 信号 处 理 领 域 的 地 


奈 硅 斯 特定 理 即 为 采样 定理 ， 指 当 采 样 频率 fs 大 于 信号 中 最 高 频率 £09 2 倍 时 , 即 
22 位 相当 之 高 ， 大致 相当 于 物理 学 领域 的 牛顿 定律 。 









































示波器 的 触发 能 使 信号 在 正确 的 位 置 点 同步 水 平 扫描 ， 使 信号 特性 清晰 。 触 发 控制 按钮 可 以 
稳定 重复 的 波形 并 捕获 单 次 波形 。 大 多 数 用 示波器 的 用 户 只 采用 边沿 触发 方式 ， 如 果 拥 有 其 他 触 
发 能 力 在 某 些 应 用 上 是 非常 有 用 的 ， 特 别 是 对 新 设计 产品 的 故障 查询 ， 先 进 的 触发 方式 可 将 所 关 
心 的 事件 分 离 出 来 ， 找 出 用 户 关心 的 非 正常 问题 ， 从 而 最 有 效 地 利用 采样 速率 和 存储 深度 。 触 发 
能 力 的 提高 可 以 较 大 提高 测试 过 程 的 灵活 性 。 
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Voltage -V- 
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Voltage -V- 
































2.8.3 逻辑 分 析 仪 


逻辑 分 











FIX F] H 
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300.0 


400.0 500.0 


2.83 ”示波器 的 TIME/DIV 设置 与 波形 























压 者 为 High， 低 于 参考 电压 者 为 Low。 











例如 ， 如 果 以 n MHz 采样 率 测量 
































可 方便 
逻辑 分 书 





电压 设 定 为 1.5V 时 ， 
E. Tfl 
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高 端的 逻辑 








iu 
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X 
BH EB. XH PTDOU 


上 采集 数字 信和 号 并 进行 显示 的 仪器 ， 
备 许 多 电压 等 级 ， 
寺 测 试 信号 通过 比较 器 来 进行 判定 ， 高 于 














不 具 




















依据 此 连 给 








JxEÉ 








编辑 探 针 、 信 号 





察看 波形 ， 











义 的 波形 可 以 显示 地 址 、 数 据 、 控 于 














之 前 应 先 编 








辑 每 个 探 钩 的 信号 名 。 


个 信号， 
超过 1.5V 则 类 
衬 波 形 可 寻找 时 序 问题 
分 析 仪 会 安装 有 Windows XP 


为 1， 





如 图 2.34 所 示 。 





逻辑 分 析 仪 会 以 1 000m ns 为 周期 采样 
IRF 1.5V 则 为 0， 将 逻辑 1 和 0 连接 成 连续 的 











其 最 主要 的 作用 是 用 
显示 两 个 电压 (逻辑 
参考 电 



































通常 只 





























信号 ML, 
"UJ 

















操作 系统 并 提供 








非常 友善 的 逻辑 分 析 应 用 软件 ， 在 




















| 信号 及 任意 外 部 探 勺 信 











号 的 变化 轨迹 ， 在 使 用 
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逻辑 分 析 仪 具有 超 强 的 逻辑 跟踪 分 
可 以 捕获 如 实时 跟踪 用 的 ETM 接 


Tx 


T, 


2 zz 
7 Z2 

y — 

p 5 

Ze 

ZN, 








2.34 逻辑 分 析 仪 及 配套 软件 








œ> 





























TIRE, Ea A RIIK BON RAE E A BS 83 Zi] 














HH, 18 





口 的 程序 执行 信息 ， 并 对 这 些 记录 进行 分 析 、 译 码 





还 原 出 应 

















用 程序 的 执行 过 程 。 因 此 ， 
充 ICD 在 跟踪 功能 方面 的 不 足 。 逻 辑 分 析 仪 与 ICD 








段 ， 如 图 









































可 使 ) 
























































2.35 所 示 。 


j 逻 辑 分 析 仪 通过 触发 接口 与 ICD (在 线 调 试 器 ) 协调 工作 以 补 
协作 可 为 工程 师 提 供 断 点 、 触 发 和 跟踪 调试 手 


eo 





ICD 是 一 个 容易 与 ICE ( 在 线 仿真 器 ) 混淆 的 概念 ，ICE 本 身 需要 完全 仿真 CPU 的 行为 , 
可 以 从 物理 上 完全 替代 CPU , 而 ICD 则 只 是 与 芯片 内 部 提供 的 典 入 式 ICE 单元 通过 JTAG 等 接 
口 互通 。 因 此 ， 对 ICD 的 硬件 性 能 要 求 远 低 于 ICE。 目 前 市 面 上 出 现 的 很 多 号 称 为 ICE 的 产品 


实际 上 是 ICD ， 如 ARM 公司 的 Multi-ICE、WindRiver 公司 的 visionICE 和 visionProbe 等 。 





逻辑 分 析 仪 
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2.85 逻辑 分 析 仪 与 ICD 协作 
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本 章 简单 地 讲解 了 驱动 软件 工程 师 必 备 的 硬件 基础 知识 ， 描 述 了 处 理 器 、 存 储 器 的 分 类 以 及 
种 处 理 器 、 存 储 器 的 原理 与 用 途 ， 并 分 析 了 常见 的 外 围 设备 接口 与 总 线 的 工作 方式 。 

此 外 ， 本 章 还 讲述 了 对 驱动 工程 师 进 行 实际 项 目 开 发 有 帮助 作用 的 原理 图 、 硬 件 时 序 分 析 方 
法 ， 数 据 手册 阅读 方法 以 及 万 用 表 、 示 波 器 和 逮 辑 分 析 仪 的 使 用 方法 。 
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本 章 导读 


本 章 为 读者 打下 Linux 驱动 编程 的 软件 基础 。 由 于 Linux 驱动 编程 本 
质 属于 Linux 内 核 编程 ， 因 此 我 们 有 必要 熟悉 Linux 内 核 及 内 核 编程 的 基 
础 知识 。 

3.1—3.2 节 讲 解 了 Linux 内 核 的 演变 及 新 版 Linux 2.6 内 核 的 特点 。 

3.3 节 分 析 了 Linux 内 核 源 代码 目录 结构 和 Linux 内 核 的 组 成 部 分 及 
其 关系 ， 并 对 Linux 的 用 户 空间 和 内 核 空间 进行 了 说 明 。 

3.4 节 讲述 了 Linux 2.6 内 核 的 编译 及 内 核 引导 过 程 。 除 此 之 外 ， 还 描 
述 了 在 Linux 内 核 中 新 增 程序 的 方法 ， 驱 动工 程 师 编写 的 设备 驱动 也 应 该 
以 此 方式 被 添加 。 

3.5 35088938 f Linux F C 编程 的 命名 习惯 以 及 Linux 所 使 用 的 GNU C 
针对 标准 C 的 扩展 语法 。 
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Linux 内 核 的 发 展 与 演变 


Linux 操作 系统 是 UNIX 操作 系统 的 一 种 克隆 系统 ， 诞 生 于 1991 年 


向 外 公布 的 时 间 )。Linux 操 
统 、Minix 操作 系统 、GNU 
1. UNIX 操作 系统 


ER 

















0 月 5 日 (第 一 次 正式 

















1 
统 的 诞生 、 发 展 和 成 长 过 程 依赖 着 5 个 重要 支柱 : UNIX 操作 系 


























计划 、Posix 标准 和 Internet。 





UNIX 操作 系统 是 美国 贝尔 实验 室 的 Ken. Thompson 和 Dennis Ritchie 于 1969 年 夏 在 DEC PDP-7 











小 型 计算 机 上 开发 的 一 个 分 时 操作 系统 。Linux 操作 系统 可 看 作 UNIX 操作 系统 的 一 个 克隆 版 本 。 


2. Minix 操作 系统 











Minix 操作 系统 也 是 UNIX 的 一 种 克隆 系统 ， 它 于 1987 年 由 著名 计算 机 教授 Andrew S. 
Tanenbaum 开发 完成 。 开 放 源 代码 Minix 系统 的 出 现在 全 世界 的 大 学 中 刊 起 了 学 习 UNIX 系统 的 














3. GNU 计划 








GNU 计划 和 自由 软件 基金 会 FSF) 是 
* GNU's Not UNIX” 的 缩写 。 到 20 | 













































































此 纪 90 年 代 初 , GNU 项 目 已 经 开发 出 许多 高 质量 的 免费 软件 ， 
包括 emacs 编辑 系统 、bash shell 程序 、gcc 系列 编译 程序 、gdb 调试 程序 等 。 这 些 软件 为 Linux 












































旋风 。Linux 刚 开 始 就 是 参照 Minix 系统 于 1991 年 才 开 始 开发 。 








Richard M. Stallman 于 1984 年 创办 的 ，GNU 是 





















































操作 系统 的 开发 创造 了 一 个 合适 的 环境 ， 是 Linux 诞生 的 基础 之 一 。 没 有 GNU 软件 环境 ，Linux 








将 寸步 难 行 。 因此， 严格 而 言 ， 














4. Posix 标准 


“Linux” MIZIEK “GNU/Linux” RA. 


Posix (Portable Operating System Interface for Computing Systems， 可 移植 的 操作 系统 接口 ) 








是 由 IEEE I ISO/IEC 开发 的 














组 标准 。 该 标 























准 基 于 现 有 的 UNIX 实践 和 经 验 完成 ， 描 述 了 操作 










































































标准 在 推动 Linux 操作 系统 朝 着 


5. Internet 





















































如 果 没 有 Intenet， 没 有 遍布 全 世界 的 无 数 计算 机 骇 客 的 无 私 奉 献 ， 那 么 Linux 最 多 只 能 发 展 

















系统 的 调用 服务 接口 ， 用 于 保证 编制 的 应 用 程序 可 以 在 源 代码 一 级 上 在 多 种 操作 系统 上 移植 。 该 
正规 化 发 展 起 着 重要 的 作用 ， 是 Linux 前 进 的 灯塔 。 



































到 0.13 (0.95) 版 的 水 平 。 从 0.95 版 开始 ， 对 内 核 的 许多 改进 和 扩充 均 以 其 他 人 为 主 了 ， 而 Linus 


























以 及 其 他 maintainer 的 主要 从 
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开始 变 成 对 内 核 的 维护 和 决定 是 否 采 用 某 个 补丁 程序 。 

















表 3.1 描述 了 Linux 操作 系统 重要 版 本 的 变迁 历史 及 各 版 本 的 主要 特点 。 






























































表 3.1 Linux 操作 系统 版 本 历史 
版 本 时 间 特 ”点 
0.1 1991.10 最 初 的 原型 
1.0 1994.3 包含 了 386 的 官方 支持 ， 仅 支持 单 CPU 系统 
1.2 1995.3 第 一 个 包含 多 平台 (Alpha、Sparc、MIPS 等 ) 支持 的 官方 版 本 
T io0eg 包含 很 多 新 的 平台 支持 ， 最 重要 的 是 ， 它 是 第 一 个 支持 SMP 对称 多 处 理 器 ) 体 
系 的 内 核 版 本 
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版 本 时 ogg 特 ”点 
22 1999.1 极 大 提升 SMP 系统 上 Linux 的 性 能 ， 并 支持 更 多 的 硬件 
eu 2051 进一步 地 提升 了 SMP 系统 的 扩展 性 ， 同 时 也 集成 了 很 多 用 于 支持 桌面 系统 的 特 
JE: USB. PC F (PCMCIA) 的 支持 ， 内 置 的 即 插 即 用 等 
无 论 是 对 于 企业 服务 器 还 是 对 于 嵌入 式 系 统 ，Linux 2.6 都 是 一 个 巨大 的 进步 。 
对 高 端的 机 器 来 说 ， 新 特性 针对 的 是 性 能 改进 、 可 扩展 性 、 吞 吐 率 ， 以 及 对 SMP 机 
2.6 2003.12 器 NUMA 的 支 持 。 对 于 嵌入 式 领 域 ， 添 加 了 新 的 体系 结构 和 处 理 器 类 型 。 包 括 对 
那些 没有 硬件 控制 的 内 存 管理 方案 的 MMU-less 系统 的 支持 。 同 样 地 ， 为 了 满足 桌 
面 用 户 群 的 需要 ， 添 加 了 一 整套 新 的 音频 和 多 媒体 驱动 程序 



























































除了 Linux 内 核 本 身 可 提供 免费 下 载 以 外 ， 
制定 了 相应 的 Linux 发 布 版 ， 如 Red Hat Linux, TurboLinux, Debian, SuSe, Ubuntu, E 


和 xteam 等 。 


























再 者 ， 针 对 舱 入 式 系统 的 应 
Linux 和 RTLinux、 支 持 不 含 MMU CPU 的 uClinux CH 























]， 提 供 更 好 的 性 能 3 个 方向 发 展 。 















































]， 一 些 改进 内 核 的 Linux 被 


前 Linux 











AK 3.1 可 以 看 出 ，Linux 的 开发 一 直 朝 着 支持 更 多 的 CPU、 硬 件 体 系 结构 和 尹 


持 更 广泛 领域 的 应 ) 








一 些 厂商 封装 了 Linux 内 核 和 大 量 有 














的 软件 包 

















面向 数字 相机 和 MP3 等 微型 府 入 式 设备 的 ThinLinux 和 以 及 颇 有 商业 背景 的 MontaVista 等 。 


Linux 2.6 ARRA 





本 书 基于 的 是 Linux 2.6 X, LDD6410 开发 板 











是 Linux 开 

















发 中 ， 
下 几 个 方面 : 





1. 新 的 调度 器 


2.6 版 本 的 Linux 内 核 使 用 了 新 的 进程 调度 算法 ， 
有 很 多 处 理 器 时 也 可 以 很 好 地 扩展 。 

2. 内 核 抢占 
在 2.6 版 本 的 Linux 内 核 中 ， 一 个 内 核 任 务 可 以 被 抢 











lE 


























发 者 群落 一 个 寄予 厚望 的 版 本 ， 从 2003 年 12 H Linux 2.6.0 发 布 至 今 ， 


WA. x 
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内 的 RedFlag 


开发 出 来 ， 如 改进 实时 性 的 Hard Hat 
mainline 已 经 支持 MMU-less 系统 )、 


内 核 的 完整 版 本 号 为 2.6.28.6。Linux 2.6 内 核 











还 处 了 































































































CER 








5， 从 而 












































主要 的 优势 在 于 ， 可 以 极 大 地 增强 系统 的 用 户 交互 性 ， 
了 更 快速 的 响应 。 














3. 改进 的 线程 模型 


2.6 版 本 的 Linux 


20 亿 。 





负载 的 情况 下 执行 得 极其 出 色 ， 

















户 将 会 觉得 











SN 














线程 操作 速度 得 以 提高 ， 











4. 虚拟 内 存 的 变化 


从 虚拟 内 存 的 角度 来 看 ，3 
程度 负载 下 的 性 能 。 























可 以 处 理 任意 









































目的 线程 ， 最 大 可 以 








善 虚拟 内 存在 一 
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还 将 稳定 较 长 一 段 时 间 。Linux 2.6 相对 于 Linux 2.4 有 相当 大 的 改进 ， 主 要 体现 在 如 














提高 系统 的 实时 性 。 这 样 做 最 
鼠标 单 击 和 击 键 的 事件 得 


到 
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5. 文件 系统 











2.6 版 内 核 增加 了 对 日 志文 件 系统 功能 的 支持 ， 解 过 
































ET 2.4 版 在 这 方面 的 不 足 。2.6 版 内 核 在 


文件 系统 上 的 关键 变化 还 包括 对 扩展 属性 及 Posix 标准 访问 控 


Linux 系统 缺 省 安装 的 文件 系统 , 在 2.6 版 内 核 中 增加 了 对 扩 


xi 


















































系统 中 嵌入 元 数据 。 


6. 音频 
































判 的 支持 。ext2/ext3 作为 大 多 数 


4 
TB 











展 属性 的 支持 , 可 以 给 指定 的 文件 在 





新 的 Linux 音频 体系 结构 ALSA (Advanced Linux Sound Architecture) 取代 了 缺陷 很 多 的 旧 的 











OSS (Open Sound System)。 新 的 声音 体系 结构 文 持 USB 音频 和 MIDI 设备 ， 并 支持 全 双 工 重 放 
等 功能 。 


7. 总 线 








SCSVIDE 子 系统 经 过 大 幅 


























度 的 重 写 ， 解 决 和 改善 了 以 前 的 一 些 问 题 。 比 如 2.6 版 内 核 可 以 直接 通 






































过 IDE 驱动 程序 来 支持 IDE CD/RW 设备 ， 而 不 必 像 以 前 一 样 要 使 





8. 电源 管理 


















































] 一 个 特别 的 SCSI 模拟 驱动 程序 。 


























支持 ACPI (高 级 电源 配置 管理 界面 ，Advanced Configuration and Power Interface )， 用 于 调整 


























CPU 在 不 同 的 负载 下 工作 于 不 同 的 时 钟 频率 以 降低 功 耗 。 


9. 联网 和 IPSec 








2.6 内 核 中 加 入 了 对 IPSec 的 支持 ， 删 除了 原来 内 核 内 置 的 HTTP 服务 器 khttpd， 加 入 了 对 新 























的 NFSv4〔 网 络 文件 系统 ) 客户 机 /服务 器 的 支持 ， 并 改进 了 对 IPv6 的 支持 。 














2.6 内 核 重 写 了 帧 缓冲 /控制 台 层 ， 人 机 界面 层 还 加 入 了 对 近乎 所 有 接口 设备 的 支持 《〈 从 触摸 






































3.3.1 






































在 设备 驱动 程序 的 方面 ，Linux 2.6 相对 于 Linux 2.4 也 有 较 大 的 改动 ， 这 主要 表现 在 内 核 API 






































1 了 不 少 新 功能 (例如 内 存 池 )、sysfs 文 伯 
模块 使 用 计数 、 模 块 加 载 和 外 载 函数 的 定义 等 方面 。 


Linux 内 核 的 组 成 


Linux 内 核 源 代 码 目 录 结 构 


10. 用 户 界面 层 
屏 到 盲人 用 的 设备 和 各 种 各 样 的 鼠标 )。 
中 增 力 























本 书 范 例 程序 所 基于 的 Linux 2.6.28.6 内 核 源 代码 包含 如 下 








€ arch: 包含 和 硬件 体系 结构 相关 的 代码 ， 每 种 3 


powerpc、mips 等 。 














FF 系统、 内 核 模块 从 .o 变 为 .ko、 驱 动 模块 编译 方式 、 








目录 。 








block: 块 设备 驱动 程序 IO 调度 。 























i2c 等 。 




















drivers: 设备 驱动 程 





区 会 IL 
ri 








crypto: 常用 加 密 和 散 列 算法 (如 AES. SHA 等 )， 还 有 一 些 压缩 和 CRC 校 验算 法 。 
Documentation: 内 核 各 部 分 的 通用 解释 和 注释 。 


个 相应 的 目录 ， 如 1386. arm. 


























序 ， 每 个 不 同 的 驱动 占用 














"sp 





录 ， 如 char. block. net, mtd, 
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e fs: 支持 的 各 种 文件 系统 ， 如 EXT、FAT、NTFS、JFFS2 等 。 

€ include: 头 文件 ， 与 系统 相关 的 头 文 件 被 放置 在 include/linux 子 目录 下 。 

€ ini: 内 核 初始 化 代码 。 

€ ipc: 进程 间 通 信 的 代码 。 

€ kernel: 内 核 的 最 核心 部 分 ， 包 括 进 程 调度 、 定 时 器 等 ， 而 和 平台 相关 的 一 部 分 代码 放 在 
arch/*/kernel 目录 下 。 

@ lib: 库 文件 代码 。 

€ mm: 内 存 管理 代码 ， 和 平台 相关 的 一 部 分 代码 放 在 arch/*/mm 目录 下 。 

€ net: 网 络 相 关 代 码 ， 实 现 了 各 种 常见 的 网 络 协 议 。 

€ scripts: 用 于 配置 内 核 的 脚本 文件 。 

€ security: 主要 是 一 个 SELinux 的 模块 。 

€ sound: ALSA、OSS 音频 设备 的 驱动 核心 代码 和 常用 设备 驱动 。 

€ us: 实现 了 用 于 打包 和 压缩 的 cpio 等 。 

















3.3.2 Linux 内 核 的 组 成 部 分 


如 图 3.1 所 示 ，Linux 内 核 主 要 由 进程 调度 (SCHED)、 内 存 管 理 (MM)、 虚 拟 文件 系统 (VFS)、 
网 络 接口 (NET) 和 进程 间 通 信 (CIPC) 5 个 子 
系统 组 成 。 
1. 进程 调度 
进程 调度 控制 系统 中 的 多 个 进程 对 CPU 
的 访问 ， 使 得 多 个 进程 能 在 CPU 中 “微观 串 
行 ， 宏 观 并 行 ” 地 执行 。 进 程 调 度 处 于 系统 的 
心 位 置 ， 内 核 中 其 他 的 子 系统 都 依赖 它 , 因 和 条 
为 每 个 子 系统 都 需要 挂 起 或 恢复 进程 。 图 3.1 Linux 内 核 的 组 成 部 分 与 关系 

如 图 3.2 所 示 ，Linux 的 进程 在 几 个 状态 间 进 行 切换 。 在 设备 驱动 编程 中 ， 当 请 求 的 资源 不 能 
得 到 满足 时 ， 驱 动 一 般 会 调度 其 他 进程 执行 ， 并 使 本 进程 进入 睡眠 状态 ， 直 到 它 请 求 的 资源 被 释 
放 ， 才 会 被 唤醒 而 进入 就 绪 态 。 睡 眠 分 成 可 被 打 断 的 睡眠 和 不 可 被 打 断 的 睡眠 ， 两 者 的 区 别 在 于 
可 被 打 断 的 睡眠 在 收 到 信和 号 的 时 候 会 醒 。 
在 设备 驱动 编程 中 ， 当 请 求 的 资源 不 能 得 到 满足 时 ， 驱 动 一 般 会 调度 其 他 进程 执行 ， 其 对 应 
进程 进入 睡眠 状态 ， 直 到 它 请 求 的 资源 被 释放 ， 才 会 被 唤醒 而 进入 就 绪 态 。 

设备 驱动 中 ， 如 果 需 要 几 个 并 发 执行 的 任务 ， 可 以 启动 内 核 线程 ， 启 动 内 核 线程 的 函数 为 : 

pid t kernel thread(int (*fn) (void *), void *arg, unsigned long flags); 


2. 内 存 管理 
内 存 管理 的 主要 作用 是 控制 多 个 进程 安全 地 共享 主 内 存 区 域 。 当 CPU 提供 内 存 管理 单元 
(MMU) 时 ，Linux 内 存 管理 完成 为 每 个 进程 进行 虚拟 内 存 到 物理 内 存 的 转换 。Linux 2.6 引入 了 
对 无 MMU CPU 的 支持 。 
如 图 3.3 所 示 ， 一 般 而 言 ，Linux 的 每 个 进程 享有 AGB 的 内 存 空 间 ，0~3GB 属于 用 户 空间 ， 
3 一 4GB 属于 内 核 空间 ， 内 核 空间 对 常规 内 存 、LIO 设备 内 存 以 及 高 端 内 存 存在 不 同 的 处 理 方式 。 
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收 到 信号 SIGCONT 
wake up () 







资源 到 位 


等 待 资源 到 位 
sleep_on () 
schedule () 


TASK_STOPPED 
暂停 











wake_up () 


TASK_UNINTERRUPTIBLE 
深度 睡眠 


fork () 














Schedule () 


schedule () 
ptrace () 


TASK. RUNNING 
就 绪 











时 间 片 耗 尽 


do_exit () 


3.2 Linux 进程 状态 转换 


TASK_INTERRUPTIBLE 
浅 度 睡眠 


TASK_ZOMBIE 
僵 死 


资源 到 位 
wake. up. interruptible() 
Jk, wake. up 0 





等 待 资源 到 位 
interruptible sleep on () 
schedule () 








拟 地 址 空 
的 用 户 空 





3. 虚拟 文件 系统 











如 图 3.4 所 示 ，Linux 虚拟 文 伯 
了 统一 的 接口 。 而 且 ， 它 独立 于 











间 || 拟 地 址 空间 
间 的 用 户 空 间 


部 分 3GB 部 分 3GB 


虚拟 地 址 空间 的 内 核 空间 部 分 1GB 


进程 ]# 的 虚 | | 进程 2H 的 虚 


进程 nt 的 虚 
拟 地 址 空间 
的 用 户 空 间 


3.3 Linux 进程 地 址 空间 








各 个 具体 的 文人 


部 分 





3GB 























系统 CVFSO 隐藏 各 种 了 硬件 的 








FAS IX 





DEG 









用 户 空 间 





应 用 程序 





系统 的 一 个 抽象 ， 它 使 





| 虚拟 文件 系统 (VFS) 


设备 文件 








3.4 Linux 文件 系统 


体 细节 ， 为 所 有 的 设备 提供 
































j 超 
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级 块 super block 存放 文件 系统 相关 信息 ， 使 用 索引 节点 inode 存放 文件 的 物理 
dentry 存放 文件 的 逻辑 信息 。 

4. 网 络 接口 

网 络 接口 提供 了 对 各 种 网 络 标准 的 存 取 和 各 种 网 络 硬件 的 支持 。 如 图 3.5 所 示 ， 在 Linux 中 
网 络 接口 可 分 为 网 络 协议 和 网 络 驱动 程序 ， 网 络 协议 部 分 负责 实现 每 一 种 可 能 的 网 络 传输 协议 ， 
网 络 设备 驱动 程序 负责 与 硬件 设备 通信 ， 每 一 种 可 能 的 人 硬件 设备 都 有 相应 的 设备 驱动 程序 。 
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言 息 ， 使 用 目录 项 


















































c 


















































用 户 空 间 
内 核 空间 


网 络 应 用 程序 


BSD Sockets 
INET Sockets Appletalk 











套 接 字 


协议 层 


3.5 Linux 网 络 体系 结构 


5. 进程 通信 
进程 通信 支持 提供 进程 之 间 的 通信 ，Linux 支持 进程 间 的 多 种 通信 机 制 ， 包 含 信号 量 、 共 享 
内 存 、 管 道 等 ， 这 些 机 制 可 协助 多 个 进程 、 多 资源 的 互 斥 访问 、 进 程 间 的 同步 和 消息 传递 。 
Linux 内 核 的 5 个 组 成 部 分 之 间 的 依赖 关系 如 下 。 
e ”进程 调度 与 内 存 管理 之 间 的 关系 : 这 两 个 子 系统 互相 依赖 。 在 多 道 程序 环境 下 ， 程 序 要 
运行 必须 为 之 创建 进程 ， 而 创建 进程 的 第 一 件 事情 ， 就 是 将 程序 和 数据 装 入 内 存 。 
e ”进程 间 通 信 与 内 存 管理 的 关系 : 进程 间 通 信子 系统 要 依赖 内 存 管理 支持 共享 内 存 通 信 机 
制 ， 这 种 机 制 允 许 两 个 进程 除了 拥有 自己 的 私有 空间 ， 还 可 以 存 取 共同 的 内 存 区 域 。 
e 虚拟 文件 系统 与 网 络 接口 之 间 的 关系 : 虚拟 文件 系统 利用 网 络 接口 支持 网 络 文件 系统 
(NFS)， 也 利用 内 存 管理 支持 RAMDISK 设备 。 
@ 内 存 管理 与 虚拟 文件 系统 之 间 的 关系 : 内 存 管理 利用 虚拟 文件 系统 支持 交换 ， 交 换 进程 
(swapd) 定期 由 调度 程序 调度 ， 这 也 是 内 存 管理 依赖 于 进程 调度 的 惟一 原因 。 当 一 个 进 
程 存 取 的 内 存 映 射 被 换 出 时 ， 内 存 管理 向 文件 系统 发 出 请 求 ， 同 时 ， 挂 起 当前 正在 运行 
的 进程 。 
除了 这 些 依赖 关系 外 ， 内 核 中 的 所 有 子 系统 还 要 依赖 于 一 些 共 同 的 资源 。 这 些 资源 包括 所 有 
子 系统 都 用 到 的 例 程 ， 如 分 配 和 释放 内 存 空间 的 函数 、 打 印 警告 或 错误 信息 的 函数 及 系统 提供 的 
调试 例 程 等 。 
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3.3.3 Linux 内 核 空 间 与 用 户 空间 

现代 CPU 内 部 往往 实现 了 不 同 的 操作 模式 级别)， 不 同 的 模式 有 不 同 的 功能 ， 
主 不 能 访问 低级 功能 ， 而 必须 以 某 种 方式 切换 到 低级 模式 。 

例如 ，ARM 处 理 器 分 为 7 种 工作 模式 。 

e 用户 模式 usr): 大 多 数 的 应 用 程序 运行 在 用 户 模式 下 ， 当 处 理 器 运行 在 
某 些 被 保护 的 系统 资源 是 不 能 被 访问 的 。 
快速 中 断 模 式 〈fiq): 用 于 高 速 数据 传输 或 通道 处 理 。 
外 部 中 断 模式 (irqg): 用 于 通用 的 中 断 处 理 。 
管理 模式 〈svc): 操作 系统 使 用 的 保护 模式 。 
数据 访问 终止 模式 〈abt): 当 数 据 或 指令 预 取 终止 时 进入 该 模式 ， 可 用 于 虚拟 存储 及 存 
储 保护 。 
€ 系统 模式 〈sys): 运行 具有 特权 的 操作 系统 任务 。 

e 未 定义 指令 中 止 模式 (und): 当 未 定义 的 指令 执行 时 进入 该 模式 ， 可 用 于 支持 硬件 协 处 
理 器 的 软件 仿真 。 
ARM Linux 的 系统 调用 实现 原理 是 采用 swi 软 中 断 从 用 户 态 usr 模式 陷入 内 核 态 sve 模式 。 

又 如 ，X86 处 理 器 包含 4 个 不 同 的 特权 级 ， 称 为 Ring 0 一 Ring 3。Ring0 下 ， 可 以 执行 特权 级 
ES, XHEP IO 设备 都 有 访问 权 等 ， 而 Ring3 则 被 限制 很 多 操作 。 

Linux 系统 充分 利用 CPU 的 这 一 硬件 特性 ， 但 它 只 使 用 了 两 级 。 在 Linux 系统 中 ， 内 核 可 进 
行 任何 操作 ， 而 应 用 程序 则 被 禁止 对 硬件 的 直接 访问 和 对 内 存 的 未 授权 访问 。 例 如 ， 若 使 用 X86 
处 理 器 ， 则 用 户 代 码 运 行 在 特权 级 3， 而 系统 内 核 代码 则 运行 在 特权 级 0。 
内 核 空 间 和 用 户 空间 这 两 个 名 词 被 用 来 区 分 程序 执行 的 这 两 种 不 同 状态 ， 它 们 使 用 不 同 的 地 
址 空间 。Linux 只 能 通过 系统 调用 和 硬件 中 断 完成 从 用 户 空间 到 内 核 空间 的 控制 转移 。 


Linux 内 核 的 编译 及 加 载 


3.4.1 Linux 内 核 的 编译 

Linux 驱动 工程 师 需要 牢固 地 掌握 Linux 内 核 的 编译 方法 以 为 租 入 式 系统 构建 可 运行 的 
Linux 操作 系统 映像 。 在 编译 LDD6410 的 内 核 时 ， 需 要 配置 内 核 ， 可 以 使 用 下 面 命令 中 的 
一 个 : 


#make config〔( 基 于 文本 的 最 为 传统 的 配置 界面 ， 不 推荐 使 用 

#make menuconfig〔 基 于 文本 菜单 的 配置 界面 》 

#make xconfig (要求 oT 被 安装 ) 

#make gconfig (要 求 GTK+ 被 安装 ) 

在 配置 Linux 2.6 内 核 所 使 用 的 make config. make menuconfig、make xconfig 和 make gconfig 
ix 4 种 方式 中 ， 最 值得 推荐 的 是 make menuconfig， 它 不 依赖 于 QT 或 GTK+， 且 非常 直观 ， 对 
LDD6410 的 Linux 2.6.28 内 核 运 行 make menuconfig 后 的 界面 如 图 3.6。 
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File Edit view Terminal Tabs Help 


Linux Kernel Configuration 
Arrow keys navigate the menu. «Enter» selects submenus --->. 
Highlighted letters are hotkeys. Pressing «Y» includes, <N> 
excludes, «M» modularizes features. Press «Esc»«Esc» to exit, 
«?» for Help, </> for Search. Legend: [*] built-in [ ] excluded 


[*] Enable loadable module support ---» 
[*] Enable the block layer ---» 

System Type ---» 

Bus support ---» 

Kernel Features ---» 

Boot options ---» 

CPU Power Management 

FLoating point emulation 

Userspace binary formats 








« Exit » « Help » 





3.6 Linux 内 核 编译 配置 























内 核 配 置 包含 的 项 目 相当 多 ，archy/arm/configs/ldd6410lcd_defconfig 文件 包含 了 LDD6410 的 
默认 配置 ， 因 此 ， 只 需要 运行 make ldd6410lcd defconfig 就 可 以 为 LDD6410 开发 板 配置 内 核 。 
编译 内 核 和 模块 的 方法 是 : 


make zImage 









































make modules 


执行 完 上 述 命令 后 ， 在 源 代 码 的 根 目录 下 会 得 到 未 压缩 的 内 核 映 像 vmlinux 和 内 核 符号 表 文 
TF. System.map， 在 arch/arm/boot/ 目 录 会 得 到 压缩 的 内 核 映 像 zImage， 在 内 核 各 对 应 目录 得 到 选中 
的 内 核 模块 。 

Linux 2.6 内 核 的 配置 系统 由 以 下 3 个 部 分 组 成 。 

€ Makefile: 分 布 在 Linux 内 核 源 代码 中 的 Makefile， 定 义 Linux 内 核 的 编译 规则 。 

e 配置 文件 (Kconfig): 给 用 户 提 供 配置 选择 的 功能 。 

e 配置 工具 : 包括 配置 命令 解释 器 (对 配 i REA: 使 用 的 配置 命令 进行 解释 ) 和 配置 用 户 

界面 (提供 基于 字符 界面 和 图 形 界面 )。 这 些 配 置 工具 都 是 使 用 脚本 语言 ， 如 TclMTK、 

Perl 等 编写 。 
使 用 make config、make menuconfig 等 命令 后 ， 会 生成 一 个 .config 配置 文件 ， 记 录 哪 些 部 分 
被 编译 入 内 核 、 哪 些 部 分 被 编译 为 内 核 模块 。 

运行 make menuconfig 等 时 ， 配 置 工具 首先 分 析 与 体系 结构 对 应 的 /arch/xxx/Kconfig 文件 (xxx 
即 为 传 入 的 ARCH digi /arch/xxx/Kconfig 文件 中 除 本 身 包含 一 些 与 体系 结构 相关 的 配置 项 和 配 
置 菜 单 以 外 ， 过 source 语句 引入 了 一 系列 Kconfig 文件 ， 而 这 些 Kconfig 又 可 能 再 次 通过 source 
引入 下 一 nd 配置 工具 依据 这 些 Kconfig 包含 的 菜单 和 项 目 即 可 描绘 出 一 个 如 图 3.6 所 
示 的 分 层 结构 。 例 如 ，/arch/arm/Kconfig 文件 的 结构 如 下 : 


mainmenu "Linux Kernel Configuration" 


















































































































































































































































































































































































































































config ARM 
bool 

default y 

select HAVE AOUT 
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select HAVE IDE 

SES cS DE 

select SYS SUPPORTS APM EMULATION 
select HAVE OPROFILE 
select HAVE ARCH KGDB 
select HAVE KPROBES if (!XIP KERNEL) 

Select HAVE KRETPROBES if (HAVE KPROBES) 
select HAVE FUNCTION TRACER if (!XIP KERNEL) 
select HAVE GENERIC DMA COHERENT 











The ARM series is a line of low-power-consumption RISC chip designs 
licensed by ARM Ltd and targeted at embedded applications and 
handhelds such as the Compaq IPAQ. ARM-based PCs are no longer 
manufactured, but legacy ARM-based PC hardware remains popular in 





Europe. There is an ARM Linux project with a web page at 
«http://www.arm.linux.org.uk/». 


config MMU 
bool 
default y 


config ARCH S3C64XX 
bool "Samsung S3C64XX" 
Select GENERIC GPIO 
select HAVE CLK 
help 
Samsung S3C64XX series based systems 


if ARCH S3C64XX 

source "arch/arm/mach-s3c6400/Kconfig" 
source "arch/arm/mach-s3c6410/Kconfig" 
endif 


3.4.2 Kconfig 和 Makefile 

f£ Linux 内 核 中 增加 程序 需要 完成 以 下 3 项 工作 。 

e 将 编写 的 源 代 码 找 入 Linux 内 核 源 代码 的 相应 目录 。 

e 在 目录 的 Kconfig 文件 中 增加 关于 新 源 代 码 对 应 项 目的 编译 配置 选项 。 

e 在 目录 的 Makefile 文件 中 增加 对 新 源 代码 的 编译 条 目 。 

1. 实例 引导 : S3C6410 处 理 器 的 RTC 驱动 配置 
在 讲解 Kconfig 和 Makefile 的 语法 之 前 ， 我 们 先 利 用 两 个 简单 的 实例 引导 读者 建立 初步 的 认识 。 
首先 , 在 linux-2.6.28-samsung/drivers/rtc 目录 中 包含 了 S3C6410 处 理 器 的 RTC 设备 驱动 源 代 
fi rtc-s3c.c. 


而 在 该 目录 的 Keonfig 文件 
ConEae nenDRvis ee 
tristate "Samsung S3C series SoC RTC" 

depends on ARCH S3C2410 ARCH S3C64XX || ARCH S5PCIXX || ARCH S5P64XX 
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包含 关于 RTC DRV S3C 的 配置 项 目 : 
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help 
RTC (Realtime Clock) driver for the clock inbuilt into the 
Samsung $3C24XX series of SoCs. This can provide periodic 
interrupt rates from lHz to 64Hz for user programs, and 


eoo 


wakeup from Alarm. 


The driver currently supports the common features on all the 
S3624XX range, suchlas che S240 98/924] 2 ASSI OV T SPESSO 
and S3C2442. 


This driver can also be build as a module. If so, the module 
will be called rtc-s3c. 


ER Kconfig 文件 的 这 段 脚本 意味 着 只 有 在 ARCH. S3C2410. ARCH. S3C64XX., ARCH. 
S5PCIXX 或 ARCH SSP64XX 项 目 之 一 被 配置 的 情况 下 ， 才 会 出 现 RTC_DRV_S3C 配置 项 目 ， 
这 个 配置 项 目 为 三 态 ( 可 编译 入 内 核 ， 可 不 编译 ， 也 可 编译 为 内 核 模 块 ， 选 项 分 别 为 “Y”“N” 
F M”), HAEEREN “Samsung S3C series SoC RTC”,“help” 后 面 的 内 容 为 帮助 信 
息 。 图 3.7 显示 了 RTC_DRV_S3C 菜单 以 及 其 help 在 运行 make menuconfig 时 的 情况 。 




































































z 






















































































File Edit view Terminal Tabs He 


Real Time Clock 
Arrow keys navigate the menu. «Enter» selects submenus ---». 
Highlighted letters are hotkeys. Pressing «Y» includes, «N» 
excludes, «M» modularizes features. Press «Esc»«Esc» to exit, 
«?» for Help, </> for Search. Legend: [*] built-in [ ] excluded 
“(-) 
< Maxim/Dallas DS1553 
Maxim/Dallas DS1742/1743 
Simtek STK17TA8 
ST M48T86/Dallas DS12887 
ST M48T35 
5T M48T59/M48T08/M48T02 
TI B04802 
EM Microelectronic V3020 
*** on-CPU RTC drivers *** 
Samsung S3C series SoC RTC 





AAAA ALARM 





< Exit > < Help > 


File Edit View Terminal Tabs Help 


Samsung S3C series SoC RTC 
CONFIG RTC DRV S3C: 


RTC (Realtime Clock) driver for the clock inbuilt into the 
Samsung S3C24XX series of SoCs. This can provide periodic 
interrupt rates from 1Hz to 64Hz for user programs, and 
wakeup from Alarm. 


The driver currently supports the common features on all the 
S3C24XX range, such as the S3C2410, S3C2412, S3C2413, S3C2440 
and S3C2442. 


This driver can also be build as a module. If so, the module 
will be called rtc-s3c. 


Symbol: RTC DRV S3C [-y] 
Prompt: Samsung S3C series SoC RTC 








3.7 Kconfig 菜单 项 目 与 帮助 信息 
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除了 布尔 型 的 配置 项 目 外 ， 还 存在 一 种 布尔 型 (bool) 配置 选项 ， 它 意味 着 要 么 编译 入 内 核 ， 





























要 么 不 编译 ， 选项 为 Edd 或 N? 











在 目录 的 Makefile 中 关于 RTC. DRV. S3C 的 编译 脚本 为 : 
obj-$(CONFIG RTC DRV S3C) += rtc-s3c.o 
上 述 脚 本 意味 着 如 果 RTC_DRV_S3C 配置 选项 被 选择 为 “Y” 或 “M”, 即 obj-$(CONFIG RTC_ 






















































































DRV_S3C) 等 同 于 obj-y 或 obj-m 时 ， 则 编译 rtc-s3c.c， 选 “Y” 的 情况 直接 会 将 生成 的 目标 代码 




































































为 


代码 ， 并 增加 或 修改 Kconfig 配置 脚本 和 Makefile 脚本 ， 完 全 仿照 上 述 过 程 执行 即 可 。 


直接 连接 到 内 核 ， 为 “M” 的 情况 则 会 生成 模块 rte-s3c.ko; 如 果 RTC DRV. S3C 配置 选项 被 选择 

















“N”, EP obj-$(CONFIG_RTC_DRV_S3C) 等 同 于 obj-n 时 ， 则 不 编译 rtc-s3c.c。 
一 般 而 言 ， 驱 动工 程 师 只 会 在 内 核 源 代码 的 drivers. 目录 的 相应 子 目 录 中 增加 新 设备 驱动 的 源 
























































2. Makefile 
这 里 主要 对 内 核 源 代码 各 级 子 目 录 中 的 kbuild (内 核 的 编译 系统 ) Makefile 进行 简单 介绍 ， 







































































这 部 分 是 内 核 模块 或 设备 驱动 的 开发 者 最 常 接触 到 的 。 


块 编译 。 除 了 y、m 以 外 的 obj-x 形式 的 目标 都 不 会 被 编译 。 

















Makefile 的 语法 包括 如 下 几 个 方面 。 
(1) 目标 定义 。 
目标 定义 就 是 用 来 定义 哪些 内 容 要 作为 模块 编译 ， 哪 些 要 编译 并 连接 进 内 核 。 
例如 : 


obj-y Lt foo.o 


表示 要 由 foo.c 或 者 foo.s 文件 编译 得 到 foo.o 并 连接 进 内 核 ， 而 obj-m 则 表示 该 文件 要 作为 模 
























































































































































而 更 常见 的 做 法 是 根据 .config 文件 的 CONFIG 变量 来 决定 文件 的 编译 方式 ， 如 : 
obj-$(CONFIG ISDN) += isdn.o 
obj-$(CONFIG ISDN PPP BSDCOMP) += isdn bsdcomp.o 


除了 obj- 形 式 的 目标 以 外 ， 还 有 lib-y library JÆ, hostprogs-y 主机 程序 等 目标 ， 但 是 基本 都 应 












































用 在 特定 的 目录 和 场合 下 。 











(2) 多 文件 模块 的 定义 。 
最 简单 的 Makefile 如 上 一 节 一 句 话 的 形式 就 够 了 ， 如 果 一 个 模块 由 多 个 文件 组 成 ， 会 稍微 复 















































杂 一 些 ， 这 时 候 应 采用 模块 名 加 -y 或 -objs 后 级 的 形式 来 定义 模块 的 组 成 文件 。 如 以 下 例子 : 








# 


# Makefile for the linux ext2-filesystem routines. 
* 


obj-$(CONFIG EXT2 FS) += ext2.o 
ext2-y C= balloc.o dir.o file.o fsync.o ialloc.o inode.o N 

ioctl.o namei.o super.o symlink.o 
ext2-$(CONFIG EXT2 FS XATTR) t= xattr.o xattr user.o xattr trusted.o 
ext2-$(CONFIG EXT2 FS POSIX ACL) 4-2 acl.o 
ext2-$(CONFIG EXT2 FS SECURITY) += xattr security.o 
ext2-$(CONFIG EXT2 FS XIP)  -*- xip.o 


模块 的 名 字 为 ext2， 由 balloc.o、dir.o、file.o 等 多 个 目标 文件 最 终 链接 生成 ext2.0 直至 ext2.ko 



























































文人 








FE， 并 且 是 否 包 括 xattr.o、acl.o 等 则 取决 于 内 核 配 置 文件 的 配置 情况 ， 例 如 ， 如 果 CONFIG 






































EXT2 FS POSIX ACL 被 选择 ， 则 编译 acl.c 得 到 acl.o 并 最 终 链 接 进 ext2。 
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(3) 目录 层次 的 迭代 。 
如 下 例 : 
obj-$(CONFIG EXT2 FS) += ext2/ 

当 CONFIG EXT2 FS 的 值 为 y 或 m 时 ，kbuild 将 会 把 ext2 ARXIA H FERK HERF. 
3. Kconfig 

内 核 配置 脚本 文件 的 语法 也 比较 简单 ， 主 要 包括 如 下 几 个 方面 。 
(1) 菜单 入 口 。 

大 多 数 的 内 核 配 置 选 项 都 对 应 Kconfig 中 的 一 个 荣 单 入 口 : 


config MODVERSIONS 
















































































bool "Module versioning support" 
help 





Usually, you have to use modules compiled with your kernel. 
Saying Y here makes it ... 


“config” 关 键 字 定 义 新 的 配置 选项 ， 之 后 的 几 行 定义 了 该 配置 选项 的 属性 。 配 置 选项 的 属性 
包括 类 型 、 数 据 范围 、 输 入 提示 、 依 赖 关 系 、 选 择 关 系 及 帮助 信息 和 默认 值 等 。 

每 个 配置 选项 都 必须 指定 类 型 ， 类 型 包括 bool. tristate. string. hex 和 int， 其 中 tristate 和 
string 是 两 种 基本 的 类 型 ， 其 他 类 型 都 基于 这 两 种 基本 类 型 。 类 型 定义 后 可 以 紧 跟 输入 提示 ， 下 
面 的 两 段 脚 本 是 等 价 的 : 

bool "Networking support" 

和 


bool 
prompt "Networking support" 


输入 提示 的 一 般 格式 为 : 
prompt «prompt» [if «expr»] 

其 中 可 选 的 让 用 来 表示 该 提示 的 依赖 关系 。 
默认 值 的 格式 为 : 
default «expr» [if «expr»] 

个 配置 选项 可 以 存在 任意 多 个 默认 值 ， 这 种 情 ; 

果 用 户 不 设置 对 应 的 选项 ， 配 置 选 项 的 值 就 是 默认 值 。 
依赖 关系 的 格式 为 : 
depends on (或 者 requires) «expr» 

如 果 定 义 了 多 重 依 赖 和 关系， 它们 之 间 用 “&& ”间隔 。 依 赖 关 系 也 可 以 应 用 到 该 菜单 中 所 有 

的 其 他 选项 (同样 接受 让 表达 式 )， 下 面 的 两 段 脚 本 是 等 价 的 : 

OO OAR 

default y if BAR 

和 

depends on BAR 

bool "foo" 

default y 

选择 关系 《也 称 为 反 向 依赖 关系 ) 的 格式 为 : 

select «symbol» [if «expr»] 

A 如 果 选 择 了 B， 则 在 A 被 选中 的 情况 下 ，B 自动 被 选中 。 
kbuild Makefile 中 的 expr (KHAR) 定义 为 : 
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有 第 一 个 被 定义 的 值 是 可 用 的 。 如 
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X«expr» ::- «symbol» 
«symbol» '-' «symbol» 
«symbol» '!2' «symbol» 
CPU «exu pw 
bI CBXDEN 


«expr» '&&' «expr» 
«expr» '||' «expr-^ 


也 就 是 说 expr 是 由 symbol. WA symbol 相等 、 两 个 symbol 不 等 以 及 expr 的 赋值 、 非 、 与 
或 运算 构成 。 而 symbol 分 为 两 类 ， 一 类 是 由 菜单 入 口 定义 配置 选项 定义 的 非常 数 symbol， 另 一 
类 是 作为 expr 组 成 部 分 的 常数 symbol。 
数据 范围 的 格式 为 : 
range «symbol» «symbol» [if <expr>] 
为 int 和 hex 类 型 的 选项 设置 可 以 接受 输入 值 范 围 ， 用 户 
小 于 等 于 第 二 个 symbol 的 值 。 
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一 个 symbol, 



























































帮助 信息 的 格式 为 : 
help (或 ---help---) 
始 
结束 
帮助 信息 完全 靠 文本 缩 进 识别 结束 。“---help---” 和 “help” 在 作用 上 没有 区 别 , 设计 “---help---” 
的 初衷 在 于 将 文件 中 的 配置 逻辑 与 给 开发 人 员 的 提示 分 开 。 





















































menuconfig 关键 字 的 作用 与 config 类 似 , 但 它 在 config 的 基础 上 要 求 所 有 的 子 选项 作为 独立 
的 行 显示 。 

(2) KEAN. 

菜单 入 口 在 菜单 树 结构 中 的 位 置 可 由 两 种 方法 决定 。 第 一 种 方式 为 : 

menu "Network device support" 


depends on NET 
config NETDEVICES 

























































































endmenu 

所 有 处 于 “menu” 和 “endmenu” 之 间 的 菜单 入 口 都 会 成 为 “Network device support" If]-T-3& 
单 。 而 且 ， 所 有 子 染 单 选 项 都 会 继承 父 荣 单 的 依赖 关系 ,比如 ,“Network device support" Xf “NET” 
的 依赖 会 被 加 到 了 配置 选项 NETDEVICES 的 依赖 列表 
注意 menu 后 面 跟 的 “Network device support” 项 目 仅仅 是 1 个 菜单 ， 没 有 对 应 真实 的 配置 选 
项 ， 也 不 有 具备 3 种 不 同 的 状态 。 这 是 它 和 config 的 区 别 。 
另 一 种 方式 是 通过 分 析 依 赖 关 系 生成 菜单 结构 。 如 果菜 单 选 项 在 一 定 程 度 上 依赖 于 前 面 的 选 
页 ， 它 就 能 成 为 该 选项 的 子 菜单 。 如 果 父 选项 为 “N”， 子 选项 不 可 见 ， 如 果 父 选项 可 见 ， 子 选项 
才能 可 见 。 例 如 : 


config MODULES 
bool "Enable loadable module support" 
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config MODVERSIONS 
bool "Set version information on all module symbols" 
depends on MODULES 








comment "module support disabled" 
depends on !MODULES 


MODVERSIONS 直接 依赖 MODULES， 只 有 MODULES 不 为 “n” 时 ， 该 选项 才 可 见 。 
除 此 之 外 ，Kconfig 中 还 可 能 使 用 “choices ... endchoice". “comment”, *if...endif" XERE 
法 结构 。 其 中 “choices ... endchoice” 的 结构 为 : 


choice 
























































<choice options> 
<choice block> 
endchoice" 


它 定义 一 个 选择 群 ， 其 接受 的 选项 (choice options) 可 以 是 前 面 描述 的 任何 属性 ， 例 如 LDD6410 
的 VGA 输出 分 辨 率 可 以 是 1 024x768 或 者 800x600， 在 drivers/video/samsung/Kconfig 就 定义 了 如 
下 的 choice: 


choice 
depends on FB S3C VGA 
prompt "Select VGA Resolution for S3C Framebuffer" 
default FB S3C VGA 1024 768 
config FB S3C VGA 1024 768 
bool "1 024*768G60Hz" 
cxlo 
TBA 
config FB S3C VGA 640 480 
bool "640*480G60Hz" 
eM 
TBA 
endchoice 


Kconfig 配置 脚本 和 Makefile 脚本 编写 的 更 详细 信息 ， 可 以 分 别 参看 内 核 文 要 Documentation 
目录 的 kbuild 子 目 录 下 的 Kconfig-language.txt 和 Makefiles.txt 文件 。 

4. 应 用 实例 : 在 内 核 中 新 增 驱 动 代码 目录 和 子 目录 

下 面 来 看 一 个 综合 实例 ， 假 设 我 们 要 在 内 核 源 代 码 drivers 目录 下 为 ARM 体系 结构 新 增 如 下 
用 于 test driver 的 树 型 目录 : 




























































































|--test 
[ e eje 
| —— etse 
|| 2 tee e 


| ees test cexbateake ce 
[|secbest ioctivo 
|== rante anoe 

|-- test queue.c 


在 内 核 中 增加 目录 和 子 目 录 ， 我 们 需 为 相应 的 新 增 目 录 创 建 Makefile 和 Kconfig 文件 ， 而 新 
增 目 录 的 父 目录 中 的 Keonfig 和 Makefile 也 需 修 改 ， 以 便 新 增 的 Keonfig 和 Makefile 能 被 引用 。 

在 新 增 的 test 目录 下 ， 应 该 包含 如 下 Kconfig 文件 : 

* 

4 TEST driver configuration 


# 


menu "TEST Driver 
























































" 


comment " TEST Driver" 


config CONFIG TEST 
POOSIS In oc 全 
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config CONFIG TEST USER 


tristate "TEST user-space interface" 


depends on CONFIG TEST 


endmenu 




















显示 “TEST support”， 等 待 用 户 选择 ， 接 下 来 判断 


























于 test driver 对 于 内 核 来 说 是 新 的 功能 ， 所 以 需 让 




















先 创 建 一 个 菜单 TEST Driver。 然 后 ， 










































































j 户 是 否 选 择 了 TEST Driver， 如 果 是 






































CCONFIG_TEST=y)， 则 进一步 显示 子 功能 : 用 户 接口 与 CPU 功能 支持 ， 由 于 用 户 接口 功能 可 以 











被 编译 成 内 核 模块 ， 所 以 这 里 的 询问 




















为 了 使 这 个 Kconfig 能 起 作用 ， 修 改 arch/arm/Kconfig x fl 








Source "drivers/test/Kconfig" 


























脚本 中 的 source 意味 着 引用 新 的 Keonfig 文件 。 























语句 使 用 了 tristate. 





在 新 增 的 test 目录 下 ， 应 该 包含 如 下 Makefile X ff: 








# drivers/test/Makefile 
LÀ 
# Makefile for the TEST. 
* 





EF， 增加 : 


obj-$(CONFIG TEST) 4- test.o test queue.o test client.o 
obj-$(CONFIG TEST USER) += test ioctl.o 
obj-$(CONFIG PROC FS) += test proc.o 


obj-$(CONFIG TEST CPU) += cpu/ 
该 脚本 根据 配置 变量 的 取 值 ， 构 建 obj-* 列 表 。 由 了 
CONFIG_TEST_CPU=y 时 ， 需 要 将 cpu 目录 加 入 列表 。 






































test 目录 中 的 epu 子 目 录 也 需 包 含 如 下 的 Makefile: 


# drivers/test/test/Makefile 
* 
4 Makefile for the TEST CPU 
# 





obj-$(CONFIG TEST CPU) += cpu.o 


为 了 使 得 整个 test. 目录 能 够 被 纺 























脚本 : 


obj-$ (CONFIG TEST) += test/ 


译 命令 作用 到 ，test 








目录 





F test 目录 中 包含 一 个 子 目 录 cpu， 当 














目录 中 的 Makefile 也 需 新 增 如 下 























在 drivers/Makefile 中 加 入 obj-$(CONFIG_TEST) += test/， 使 得 在 用 户 在 进行 内 核 编译 时 能 











够 进入 test 目录。 











增加 了 Kconfig 和 Makefile 之 后 的 新 的 test 树 型 目录 


lest 
c (ui 
I.E De 
| -- Makefile 
mem SEI 


ZS TES CLINE: E 
z EESE FOCE 
=s sere QC 
-- test queue.c 
-- Makefile 
Or 
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3.4.3 Linux 内 核 的 引导 

引导 Linux 系统 的 过 程 包括 很 多 阶段 ， 这 里 将 以 引导 X86 PC 为 例 来 进行 讲解 。 引 导 X86 PC 
上 的 Linux 的 过 程 和 引导 舱 入 式 系统 上 的 Linux 的 过 程 基本 类 似 。 不 过 在 X86 PC 上 有 一 个 从 BIOS 
(基本 输入 /输出 系统 ) 转移 到 Bootloader 的 过 程 ， 而 虑 入 式 系统 往往 复位 后 就 直接 运行 Bootloader。 
图 3.8 所 示 为 X86 PC 上 从 上 电 / 复 位 到 运行 Linux 用 户 空 间 初 始 进程 的 流程 。 在 进入 与 Linux 
相关 代码 之 间 ， 会 经 历 如 下 阶段 。 


上 电 / 复 位 
系统 启动 BIOS 


Bootloader 的 第 一 阶段 MBR 


000 
































































































































Bootloader 的 第 二 阶段 LILO、GRUB 等 


内 核 


用 户 空间 








3.8 X86 PC 上 的 Linux 引导 流程 




















(OD 当 系 统 上 电 或 复位 时 ，CPU 会 将 PC 指针 赋值 为 一 个 特定 的 地 址 OxFFFFO 并 执行 该 地 址 
处 的 指令 。 在 PC 机 中 ， 该 地 址 位 于 BIOS 中 ， 它 保存 在 主板 上 的 ROM 或 Flash 中 。 
(2) BIOS 运行 时 按照 CMOS 的 设置 定义 的 启动 设备 顺序 来 搜索 处 于 活动 状态 并 且 可 以 引导 
的 设备 。 若 从 硬盘 启动 ，BIOS 会 将 硬盘 MBR 〈 主 引导 记录 ) 中 的 内 容 加 载 到 RAM。MBR 是 一 
个 512 字 节 大 小 的 扇 区 ， 位 于 磁盘 上 的 第 一 个 扇 区 中 〈0 道 0 柱 面 1 扇 区 )。 当 MBR 被 加 载 到 RAM 
之 后 ，BIOS 就 会 将 控制 权 交 给 MBR- 
G) 主 引 导 加 载 程序 查找 并 加 载 次 引导 加 载 程序 。 它 在 分 区 表 中 查找 活动 分 区 ， 当 找到 一 个 
活动 分 区 时 ， 扫 描 分 区 表 中 的 其 他 分 区 ， 以 确保 它们 都 不 是 活动 的 。 当 这 个 过 程 验证 完成 之 后 ， 
就 将 活动 分 区 的 引导 记录 从 这 个 设备 中 读 入 RAM 中 并 执行 它 。 
(4) 次 引导 加 载 程序 加 载 Linux 内 核 和 可 选 的 初始 RAM 磁盘 ， 将 控制 权 交 给 Linux 内 核 源 代码 。 
C5) 运行 被 加 载 的 内 核 ， 并 启动 用 户 空间 应 用 程序 。 
WONG REP. Linux 的 引导 过 程 与 之 类 似 ， 但 一 般 更 加 简洁 。 不 论 具 体 以 怎样 的 方式 实现 ， 
只 要 具备 如 下 特征 就 可 以 称 其 为 Bootloader。 
@ 可 以 在 系统 上 电 或 复位 的 时 候 以 某 种 方式 执行 ， 这 些 方式 包括 被 BIOS 引导 执行 、 直 接 
在 NOR Flash 中 执行 、NAND Flash 中 的 代码 被 MCU 自动 拷 入 内 部 或 外 部 RAM 执行 等 。 
e 能 将 U 盘 、 磁 盘 、 光 盘 、NOR/NAND Flash. ROM. SD 卡 等 存储 介质 ， 甚 或 网 口 、 唱 
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口中 的 操作 系统 加 载 到 RAM 并 把 控制 权 交 给 操作 系统 源 代 码 执 行 。 

完成 上 述 功 能 的 Bootloader 的 实现 方式 非常 多 样 化 ， 甚 至 本 身 也 可 以 是 一 个 简化 版 的 操作 系 
统 。 著 名 的 Linux Bootloader 包括 应 用 于 PC 的 LILO 和 GRUB, NEFIT HEC SX ZR ZEIT] U-Boot, 
RedBoot 等 。 

相 比 较 于 LILO，GRUB 本 身 能 理解 EXT2、EXT3 文件 系统 ， 因 此 可 在 文件 系统 中 加 载 Linux， 
而 LILO 只 能 识别 “ 裸 扇 区 ”。 

U-Boot 的 定位 为 “Universal Bootloader”， 其 功能 比较 强大 ， 涵 盖 了 包括 PowerPC. ARM. 
MIPS 和 X86 在 内 的 绝 大 部 分 处 理 器 构架 ， 提 供 网 卡 、 串 口 、Flash 等 外 设 驱 动 ， 提 供 必 要 的 网 络 
协议 (BOOTP、DHCP、TFTP)， 能 识别 多 种 文件 系统 (cramfs、fat、jffs2 和 registerfs 等 )， 并 附 
带 了 调试 、 肢 本、 引导 等 工具 ， 应 用 十 分 广泛 。 

Redboot 是 Redhat 公司 随 eCos 发 布 的 Bootloader 开源 项 目 ， 除 了 包含 U-Boot 类 似 的 强大 功 
能 外 ， 它 还 包含 GDB stub( 插 桩 )， 因 此 能 通过 串口 或 网 口 与 GDB 进行 通信 ， 调 试 GCC 产生 的 
任何 程序 (包括 内 核 )。 

我 们 有 必要 对 上 述 流程 的 第 5 个 阶段 进行 更 详细 的 分 析 ， 它 完成 启动 内 核 并 运行 用 户 空间 的 
















































































































































































































































































当 内 核 映 像 被 加 载 到 RAM 之 后 ，Bootloader 的 控制 权 被 释放 ， 内 核 阶段 就 开始 了 。 内 核 映 像 
并 不 是 完全 可 直接 执行 的 目标 代码 ， 而 是 一 个 压缩 过 的 zImage (小 内 核 ) 或 bzImage〈( 大 内核 ， 
bzImage 中 的 b 是 “big” 的 意思 )。 

但 是 ， 并 非 zImage 和 bzImage 映像 中 的 一 切 都 被 压缩 了 ， 否 则 Bootloader 把 控制 权 交 给 这 个 
内 核 映 像 它 就 “ 傻 ” 了 。 实 际 上 ， 映 像 中 包含 未 被 压缩 的 部 分 ， 这 部 分 中 包含 解压 缩 程 序 ， 解 压 
缩 程序 会 解压 映像 中 被 压缩 的 部 分 。zImage 和 bzImage 都 是 用 gzip 压缩 的 ， 它 们 不 仅 是 一 个 压缩 
文件 ， 而 且 在 这 两 个 文件 的 开头 部 分 内 骨 有 gzip 解压 缩 代 码 。 
如 图 3.9 所 示 ， 当 bzImage CHF 1386 映像 ) 被 调用 时 ， 它 从 /arch/i386/boot/head.S 的 start 汇 
编 例 程 开 始 执行 。 这 个 程序 执行 一 些 基 本 的 硬件 设置 并 调用 /arch/i386/boot/compressed/head.S 中 的 
startup 32 例 程 。startup_32 程序 设置 一 些 基本 的 运行 环境 (如 堆栈 ) 后 ， 清 除 BSS 段 ， 调 用 /arch/ 
i386/boot/compressed/misc.c 中 的 decompress kernel() C 函数 解压 内 核 。 内 核 被 解压 到 内 存 中 之 后 ， 
会 再 调用 /arch/i386/kernel/head.S 文件 中 的 startup_32 例 程 ， 这 个 新 的 startup_32 例 程 〈 称 为 清除 


























































































































































































































































































































































































































start () /arch/i386/boot/head.S 
startup. 32 () /arch/i386/boot/compress/head.S 
TSi 
decompress_kernel () /arch/i386/boot/compress/misc.c 
startup 32 () farch/i386/kernel /head.S 
start. kernel () /init/main.c 
cpu idle () /init/main.c 


3.9 X86 PC 上 的 Linux 内 核 初始 化 
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程序 或 进程 0) 会 初始 化 页 表 ， 并 启用 内 存 分 页 机 制 ， 接 着 为 任何 可 选 的 浮 点 单元 CFPUO 检测 
CPU 的 类 型 ， 并 将 其 存储 起 来 供 以 后 使 用 。 这 些 都 做 完 之 后 ，/init/main.c 中 的 start. kernel P Zi 
被 调用 ， 进 入 与 体系 结构 无 关 的 Linux 内 核 部 分 。 

start_kernel() 会 调用 一 系列 初始 化 函数 来 设置 中 断 ， 执 行进 一 步 的 内 存 配 置 。 之 后 ，/arch/ 
i386/kernel/process.c 中 kernel_thread() 被 调用 以 启动 第 一 个 核心 线程 , 该 线程 执行 init0 函 数 , 而 原 
执行 序列 会 调用 cpu_idle() 等 竺 调度。 

作为 核心 线程 的 init0 函 数 完成 外 设 及 其 驱动 程序 的 加 载 和 初始 化 ， 挂 接 根 文件 系统 。init() 
打开 /dev/console 设备 ， 重 定向 stdin、stdout 和 stderr 到 控制 台 。 之 后 ， 它 搜索 文件 系统 中 的 init 
程序 (也 可 以 由 “init=” 命 令 行 参数 指定 init 程序 )， 并 使 用 execve0 系 统 调用 执行 init 程序 。 搜 
索 init 程序 的 顺序 为 ，/sbin/init、/etc/init、/bin/init 和 /bin/sh。 在 伦 入 式 系统 中 ， 多 数 情况 下 ， 可 
以 给 内 核 传 入 一 个 简单 的 shell 脚本 来 启动 必需 的 嵌入 式 应 用 程序 。 

至 此 ， 漫 长 的 Linux 内 核 引 导 和 启动 过 程 就 此 结束 ， 而 init0) 对 应 的 这 个 由 start. kernel0 创 建 
的 第 一 个 线程 也 进入 用 户 模 式 。 


Linux 下 的 C RERA 


3.5.1 Linux 编码 风格 

Linux 程序 的 命名 习惯 和 Windows 程序 的 命名 习惯 及 著名 的 匈牙利 命名 法 有 很 大 的 不 同 。 

在 Windows 程序 中 ， 习 惯 以 如 下 方式 命名 宏 、 变 量 和 函数 : 

#define PI 3.141 592 6 /* 用 大 写字 母 代表 宏 */ 

int minValue, maxValue; /* 变 量 : 第 一 个 单词 全 写 ， 其 后 的 单词 第 一 个 字母 小 写 */ 

void SendData (void); /* 隙 数 ， 所 有 单词 第 一 个 字母 都 大 写 定义 */ 

这 种 命名 方式 在 程序 员 中 非常 盛行 ， 意 思 表 达 清 晰 且 避 免 了 匈牙利 法 的 腑 肿 ， 单 词 之 间 通 过 
首 字 母 大 写 来 区 分 。 通 过 第 1 个 单词 的 首 字母 是 否 大 写 可 以 区 分 名 称 属于 变量 还 是 属于 函数 ， 而 
看 到 整 串 的 大 写字 母 可 以 断定 为 宏 。 实 际 上 ，Windows 的 命名 习惯 并 非 仅 限于 Windows 编程 ， 大 
多 数 领域 的 程序 开发 都 遵照 此 习惯 。 

但 是 Linux 不 以 这 种 习惯 命名 ， 对 应 于 上 面 的 一 段 程序 ， 在 Linux 中 会 被 命名 为 : 

#define PI 3.141 592 6 


int min value, max value; 
void send data (void); 


上 述 命名 方式 中 ， 下 划 线 大 行 其 道 ， 不 依照 Windows 所 采用 的 首 字母 大 写 以 区 分 单词 的 方式 。 
Linux 的 命名 习惯 与 Windows 命名 习惯 各 有 千秋 ， 但 是 既然 本 书 和 本 书 的 读者 立足 于 编写 Linux 
程序 ， 代 码 风 格 理应 保持 与 Linux 开发 社区 的 一 致 性 。 

Linux 的 代码 缩 进 使 用 “TAB”(8 个 字符 )。 

Linux 的 代码 括号 “{” 和 “} ”的 使 用 原则 如 下 。 

CD 对 于 结构 体 、if/for/while/switch 语句 ,“{” 不 另 起 一 行 ， 例 如 : 


ENraeb(eE. syeuc datan 
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int len; 
char data[0]; 
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if (a == b) ( 
ac; 
Q = a 
} 
下 人 
a= 
d=a 


























(2) 如 果 if for 循环 后 只 





iena Kab c uo aL x AMO abspsy) 


Eos «S 4498 
a C0; 


i++) 











{ 


5 1 行 ， 不 要 加 M 和 TT, 例如 : 





























else if (x » y) (t 


else { 


aime -exelel(GabeE ers uim. o) 


return a + b; 





在 switch/case 语句 方面 ，Linux 建议 switch 和 case 对 齐 ， 例 如 ; 


switch (suffix) ( 
case 'G': 
case 'g': 
mem ««- 30; 
break; 
case 'M': 
case 'm': 


mem ««- 20; 


break; 
case 'K': 
case 'k': 

mem ««- 10; 

[a al noe = 
default: 


break; 
j 


j 的 情况 下 ，else 语句 不 男 起 一 行 ， 例 如 : 


(4) 对 于 函数 ,“{” 另 起 一 行 ， 壁 如 : 





内 核 下 的 Documentation/CodingStyle 描述 了 Linux 内 核对 编码 风格 的 要 求 ， 内 核 下 的 


scripts/checkpatch.pl 提供 了 1 个 检查 代码 风格 的 脚本 。 如 果 我 们 使 


含 如 下 代码 块 的 源 程序 : 















































] scripts/checkpatch.pl 检查 包 
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就 会 产生 


“WARNING: braces {} are not necessary for single statement blocks” 的 警告 








另外 ， Wy 




















ERREP ERAMA, S “for(i; BAR "o" 85 








3.5.2 GNU C 5 ANSI C 





Linux 上 可 用 的 C 编 
































Ear GNU C 编译 器 ， 它 建立 在 自由 软件 基金 会 的 编程 许可 证 的 基础 上 ， 

































































因此 可 以 

















GNU C fù 


Rhio GNU C 对 标准 C 进行 
1. 零 长 度 和 变量 长 度数 组 


























系列 扩展 ， 以 增强 标准 C 的 功能 。 



































许 使 用 零 长 度数 组 ， 在 定义 变 长 对 象 的 头 结构 时 ， 这 个 特性 非常 有 用 。 例 如 ， 




















Sus e EVI IHE CI cts CN 


int len; 
char data[0]; 


}; 





char data[0] 仅 仅 意 味 
第 index 个 地 址 ， 它 并 没有 为 data[] 数 组 分 配 内 存 ， 因 此 sizeof(struct var. data)-sizeof(int). 


























程序 ! 





通过 var data 结构 体 实例 的 data[index] 成 员 可 以 访问 len 之 后 的 









































假设 struct var. data 的 数据 域 就 保存 在 struct var data 紧 接 着 的 内 存 区 域 ， 则 通过 如 下 代码 可 
以 遍历 这 些 数据 : 


STEnect uvarc ea, 





for fi s 





























OES Fen aE) 


e002 el 











GNU C! 
int main 


{ 





ahte abe. 9gl s 

















也 可 以 使 


(EEC 





] 1 个 变量 定义 数组 ， 例 如 如 下 代码 中 定义 的 “double x[n] ": 


char *argv[]) 


argc; 


double x[n]; 


Cox ds errore ome 


So 


] 9 xg 


return 0; 


j 


2. case 范围 


GNU C 支持 case x...y 这 样 的 语法 ， 














区 间 [x,y] 的 数 都 会 满足 这 个 case 的 条 件 ， 请 看 下 面 的 
































代码 : 
switch (ch) ( 
Gales toe arce TOR 
break; 
caseiras UU P e ee S epu 
oreak; 
(oreste Mp igi ise ccs Me CSI E 
break; 
j 
代码 中 的 case '0'... '9' 等 价 于 标准 C 中 的 : 
case "UJ. case "I7. cage 2 case "3! case T5. 
case "B's nase Gu :OSD /OAS SR case t9. 


eo 
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3. 语句 表达 式 

GNU C 把 包含 在 括号 中 的 复合 语句 看 做 是 一 个 表达 式 ， 称 为 语句 表达 式 ， 它 可 以 出 现在 任何 
允许 表达 式 的 地 方 。 我 们 可 以 在 语句 表达 式 中 使 用 原本 只 能 在 复合 语句 中 使 用 的 循环 、 局 部 变量 
等 ， 例 如 : 


define min me 
(he c oe m OLBIA ess VR. og m B pege c SHE S) 
















































































H 





























aW, aey aone RENER 
float riar TO minty 





mini MANEA "abere. LOTS 
minf MIME EL OGAE Ear 3:19) R 


因为 重新 定义 了 _xx M y 这 两 个 局 部 变量 ,所 以 以 上 述 方式 定义 的 宏 将 不 会 有 各 
准 C 中， 对 应 的 如 下 宏 则 会 产生 副作用 : 


























作用 。 在 标 





m 






























































ddefine mimixvb E E 


代码 min(++ia,++ib) 会 被 展开 为 ((++ia) < (+ib) ? (tia): (++ib))， 传 入 宏 的 “参数 ”被 增加 














2 次。 
4. typeof 关键 字 





























typeof(x) 语 句 可 以 获得 x 的 类 型 ， 因 此 ， 我 们 可 以 借助 typeof 重新 定义 min 这 个 宏 : 
#define min(x,y) ({ \ 

const typeof(x) = (x); N 

CON CE twsxexenr(o) xe e Qe N 

(void) (& x == & y); \ 

DG own Eo cO. Tw dy 








我 们 不 需要 像 min_t(type,x,y) 这 个 宏 那 样 把 type 传 入 ， 因 为 通过 typeof(x)、typeofty) 可 以 获得 
type。 代 码 行 (void) (& x = &_y) 的 作用 是 检查 x 和 _y 的 类 型 是 否 一 致 。 

5. 可 变 参 数 宏 
标准 C 就 支持 可 变 参 数 函 数 ， 意 味 着 函数 的 参数 是 不 固定 的 ， 例 如 printtO 函 数 的 原型 为 ; 

































































Me dnl Conse Gae ensue lp eluents ee 六 
而 在 GNU C 中 ， 宏 也 可 以 接受 可 变数 目的 参数 ， 例 如 : 
ele ie ne N 


printk (fmt, ##arg) 
XX Hi arg AG RII RT ULTRA E ES. IX EEUU EA ESR arg 的 值 
在 宏 扩 展 时 蔡 换 arg， 例 如 下 列 代码 : 
pr debug("$s:$d",filename,line) 
会 被 扩展 为 : 
printk("$s:$d", filename, line) 
EH] "i" RATH arg 不 代表 任何 参数 的 情况 ， 这 时 候 ， 前 面 的 逗号 就 变 得 多 余 了 。 
使 用 “大” 之 后 ，GNU C 预 处 理 器 会 丢弃 前 面 的 逗号 ， 这 样 ， 代 码 : 
pr debug ("success!Vn") 
会 被 正确 地 扩展 为 : 
Orel (Se ceS SATU) 
而 不 是 : 
printk("success!VWn",) 


这 正 是 我 们 希望 看 到 的 。 
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eoo 


6. 标号 元 素 

标准 C 要 求 数 组 或 结构 体 的 初始 化 值 必须 以 固定 的 顺序 出 现 ， 在 GNU. C 中 ， 通 过 指定 索引 
或 结构 体 成 员 名 ， 人 允许 初始 化 值 以 任意 顺序 出 现 。 

指定 数组 索引 的 方法 是 在 初始 化 值 前 添加 “[INDEX] 2", 当然 也 可 以 用 “[FIRST ... LAST] =” 
的 形式 指定 一 个 范围 。 例 如 ， 下 面 的 代码 定义 一 个 数组 ， 并 把 其 中 的 所 有 元 素 赋 值 为 0: 

unsigned char data[MAX] S= ( [O ... MAX-1] 0 

下 面 的 代码 借助 结构 体 成 员 名 初始 化 结构 体 : 


struct file operations ext2 file operations = { 



























































































































































MM 


























llseek: generic file llseek, 
read: generic file read, 
write: generic file write, 
auoxewEldlg. i» dox. 
mmap: generic file mmap, 
open: generic file open, 
release: ext2 release file, 
fsync: ext2 sync file, 
}; 
但 是 ，Linux 2.6 推荐 类 似 的 代码 应 该 尽量 采用 标准 C 的 方式 : 


struct file operations ext2 file operations = { 





Hh 




















.llseek = generic_file_llseek, 
.read = generic file read, 
.write = generic file write, 
.aio read = generic file aio read, 
.aio write = generic file aio write, 
"unos = ext2 ioctl, 

. mmap = generic_file_mmap, 
.open = generic file open, 
.release- ext2 release file, 

.fsync = ext2 sync file, 

.readv = generic file readv, 
.writev = generic file writev, 
.sendfile = generic file sendfile, 


EE 

7. 当前 函数 名 

GNU C 预定 义 了 两 个 标志 符 保 存 当前 函数 的 名 字 ，_ FUNCTION 保存 函数 在 源码 中 的 名 
字 ， | PRETTY FUNCTION 保存 带 语言 特色 的 名 字 。 在 C 函数 中 ， 这 两 个 名 字 是 相同 的 。 


void example () 
( 












































Jone A (MIs bey E CICNE LO S ML. UNIG ERON Jp 
} 
REPR FUNCTION AREFE “example”. C99 已 经 支持 ”func Z, HEEE 


Linux 编程 中 不 再 使 用 FUNCTION , meemit func : 
void example () 


{ 
























































Teel ne on et se sebo ONEGHO MEA SM. UG . ) p 


} 
8. 特殊 属性 声明 
GNU C 允许 声明 函数 、 变 量 和 类 型 的 特殊 居 


方法 。 要 指定 一 个 声明 的 属性 ， 只 需要 在 声 























性 ， 以 便 进 行 手 工 的 代码 优化 和 定制 代码 检查 的 
月 后 添加 attribute — (( ATTRIBUTE ))。 其 中 


INUX 





























IH Zn 
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ATTRIBUTE 为 属性 说 明 ， 如 果 存 在 多 个 属性 , WIDE AS. GNU C 支持 noreturn、format、section、 
aligned, packed 等 十 多 个 属性 。 

noreturn 属性 作用 于 函数 ， 表 示 该 函数 从 不 返回 。 这 会 让 
警告 信息 。 例 如 ; 


4$ define ATTRIB NORET . attribute  ((noreturn)) .... 
asmlinkage NORET TYPE void do exit(long error code) ATTRIB NORET; 


format 属性 也 用 于 函数 ， 表 示 该 函数 使 用 printf. scanf 或 strftime 风格 的 参数 ， 指 定 format 
属性 可 以 让 编译 器 根据 格式 串 检查 参数 类 型 。 例 如 : 

SEE 
上 述 代 码 中 的 第 1 个 参数 是 格式 串 ， 从 第 2 个 参数 开始 都 会 根据 printfO 函 数 的 格式 串 规 则 检 
查 参数 。 

unused 属性 
器 产生 警告 信息 。 

aligned 属性 用 于 变量 、 结 构 体 或 联合 体 ， 指 定 变 量 、 结 构 体 或 联合 体 的 对 界 方式 ， 以 字 节 为 
单位 ， 例 如 : 


struct example struct 



































An 
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作用 于 函数 和 变量 ， 表 示 该 函数 或 变量 可 能 不 会 被 用 到 ， 这 个 属性 可 以 避免 编译 






















































































eher &p 
alia lop 
Long c? 
Ho attribute  ((aligned(4))); 


表示 该 结构 类 型 的 变量 以 4 字 节 对 界 。 
packed 属性 作用 于 变量 和 类 型 ， 用 于 变量 或 结构 体 成 员 时 表示 使 用 最 小 可 能 的 对 界 ， 用 于 榴 
举 、 结 构 体 或 联合 体 类 型 时 表示 该 类 型 使 用 最 小 的 内 存 。 例 如 : 


struct example struct { 





































































































per 











ehar ar 

agen. log 

iong e oeer pute packed); 
}; 





例如 ，, 对 于 一 个 32 位 的 整 型 变量 ， 若 以 4 字 节 方式 存放 ( 即 低 两 位 地 址 为 00 ), 则 CPU 在 一 


编译 器 对 结构 体 成 员 及 变量 对 界 的 目的 是 为 了 更 快 地 访问 结构 体 成 员 及 变量 占据 的 内 存 。 
2 个 总 线 周期 内 就 可 以 读 取 32 位 ; ETA , CPU 需要 两 次 总 线 周期 才能 组 合 为 一 个 32 位 整 型 。 








9. 内 建 函 数 
GNU C 提供 了 大 量 的 内 建 函 数 ， 其 中 大 部 分 是 标准 C. 库 函 数 的 GNU C 编译 器 内 建 版 本 ， 例 
如 memcpy() 等 ， 它 们 与 对 应 的 标准 C. 库 函 数 功能 相同 。 
不 属于 库 函 数 的 其 他 内 建 函 数 的 命名 通常 以 _builtin 开始 ， 如 下 所 示 。 
e 内 建 函 数 。_builtin_return_address (LEVEL) 返 回 当前 函数 或 其 调用 者 的 返回 地 址 ， 人 参数 
LEVEL 指定 调用 栈 的 级 数 ,， 如 0 表示 当前 函数 的 返回 地 址 ，!1 表示 当前 函数 的 调用 者 的 
返回 地 址 。 
内 建 函 数 。、_builtin_constant _p(EXP) 用 于 判断 一 个 值 是 否 为 编译 时 常数 ， 如 果 参 数 EXP 
的 值 是 常数 ， 函 数 返 回 1， 和 否则 返回 0。 
€ iP builtin expect(EXP, C) 用 于 为 编译 器 提供 分 支 预测 信息 ， 其 返回 值 是 整数 表达 
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X EXP 的 值 ，C 的 值 必须 是 编译 时 常数 。 
































例如 ， 下 面 的 代码 检测 第 1 个 参数 是 否 为 编译 时 常数 以 确定 采用 





代码 : 

Oe test bit(nr,addr) y 
Obniltin constante ninry) v? X 
constant test bit((nr),(addr)) : w^ 


) 
variable test bit((nr), (addr)) 





























数 版 本 还 是 非 参数 版 本 的 





Y 


















































在 使 用 gcc 编译 C 程序 的 时 候 ， 如 果 使 用 
用 GNU 扩展 语法 。 例 如 对 于 如 下 C 程序 test.c: 


SsEruct var data -i 


























int len; 
char data[0]; 
}; 


Struct var'data a; 






































*-ansi pedantic ”编译 





选项 ， 则 会 告诉 编译 器 不 使 



























































自 接 编译 可 以 通过 : 
gec e tesi E 

如 果 使 用 “-ansi -pedantic” 编 译 选 项 ， 编 译 会 报警 : 
gec ansi pedant iie ei teste 

test.c:3: warning: ISO C forbids zero-size array 


3.5.3 do {} while(0) 


"data" 








在 Linux 内 核 中 ， 经 常会 看 到 do {} while(0) 这 样 的 语句 ， 许 多 人 开始 都 会 疑惑 ， 认 为 do 人 












































while(0) 毫 无 意义 ， 
while(0) 的 用 法 主要 用 于 宏 定义 中 。 
这 里 用 一 个 简单 点 的 宏 来 演示 : 























define SAFE FREE(p) do{ free(p); p = 








define SAFE FREE (p) NULL; 


那么 以 下 代码 


free(p); p 三 























if (NULL != p) 
SAFE_DELETE (p) 
else 


do 0 eE Bonnetia A 
会 被 展开 为 : 
if(NULL != p) 

free(p); p = NULL; 


else 
oo) Ol eae 


展开 的 代码 中 存在 两 个 问题 。 




















(1) 因为 这 分支 后 有 两 个 语句 ， 导 致 else DLRA RMA if, g 














姑 为 它 只 会 执行 一 次 ， 加 不 加 do (9 while(0) 效 果 是 完全 一 样 的 ， 其 实 do G 





NULL;) while(0) 
段 设 这 里 去 掉 do...while(0)， 即 定义 SAFE DELETE 73: 





译 失 败 。 

















(2) 假设 没有 else 分支 ， 则 SAFE FREE ' 
的 确 ， 将 SAFE FREE 的 定义 加 上 人 就 可 以 
fdefine SAFE FREE (p) 


这 样 ， 代 码 : 








es 





解决 上 述 问题 了 ， 即 : 


p » NULL;] 








的 第 二 个 语句 无 论 这 测试 是 否 通过 ， 都 会 执行 。 
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ie (NULE t= 19) 
SAFE_DELETE (p) 
else 


aga V? CO SENEC nine, 7 
会 被 展开 为 : 
TL = jS) 

( free(p); p = NULL; ] 
else 








Se /le eve ee A 
但 是 ， 在 C 程序 中 ， 每 个 语句 后 面 加 分 号 是 一 种 约定 俗 成 的 习惯 ， 那 么 ， 如 下 代码 : 
ar (wuu = qj) 

SAFE DELETE (p); 
else 




















... /* do something */ 
将 被 扩展 为 : 
1 = 
free(p); p - NULL; ); 
else 
/* do something */ 


这 样 ，else 分 支 就 又 没有 对 应 的 这 了 ， 编 译 将 无 法 通过 。 假 设 用 了 do () while(0)， 情 况 就 不 
一 样 了 ， 同 样 的 代码 会 被 展开 为 : 

if (NULL != p) 
do{ free(p); p = NULL;) while(0); 










































































else 
/* do something */ 


再 出 现 编译 问题 。do while(0) 的 使 用 完全 是 为 了 保证 宏 定义 的 使 用 者 能 无 编译 错误 地 使 
不 对 其 使 用 者 做 任何 假设 。 


3.5.4 goto 
不 用 goto 一 直 是 一 个 著名 的 争议 话题 ，Linux 内 核 源 代码 中 对 goto 的 应 用 非常 广泛 ,但 是 
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一 般 只 限于 错误 处 理 中 ， 其 结构 如 : 
if(register a()!=0) 
goto err; 
if(register b()!20) 


goto errl; 
if (register c()!-0) 
goto err2; 
if(register d()!20) 
goto err3; 


err3: 

unregister c(); 
err2: 

unregister b(); 
errl: 

unregister a(); 
queat 


return ret; 
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的 用 法 实在 是 简单 而 高 效 ， 只 需 保证 在 错误 处 理 时 注销 、 资 源 释 放 等 




















这 种 goto 用 于 错误 处 理 


























与 正常 的 注册 、 资 源 申请 顺序 相反 。 





SN] i: 











本 章 主 要 讲解 了 Linux 内 核 和 Linux 内 核 编程 的 基础 知识 ， 为 进行 Linux 驱动 开发 打下 软件 
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方法 及 内 核 引 导 过 程 。 








在 Linux 内 核 方 面 ， 主 要 4 






































介绍 了 Linux 内 核 的 发 展 史 、 组 成 、 特 点 、 源 代码 结构 、 内 核 编译 



































于 Linux 驱动 编程 本 





























质 属于 内 核 编程 ， 因 此 掌握 内 核 编程 的 基础 知识 显得 尤为 重要 。 本 章 









































在 这 方面 主要 讲解 了 在 内 核 ! 
F C 编程 习惯 以 及 Linux 所 
































新 增 程序 及 目录 和 编写 Kconfig 和 Makefile 的 方法 ， 并 分 析 了 Linux 
使 用 的 GNU C 针对 标准 C 的 扩展 语法 。 
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Linux 设备 驱动 会 以 内 








核 模块 编程 是 学 习 Linux 设备 驱动 的 先决 条 件 。 
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核 模 块 的 形式 出 现 ， 因 此 ， 学 会 编写 Linux 内 











4.1 一 4.2 节 讲 解 了 Linux 内 核 模 块 的 概念 和 结构 ，4.3 一 4.8 节 对 Linux 




















内 核 模块 的 各 个 组 成 部 分 进行 了 展现 ，4.1 一 4.2 节 与 4.3—4.8 节 是 整体 与 


部 分 的 关系 。 
4.9 节 说 明了 独立 存在 
模块 的 编译 方法 。 
































的 Linux 内 核 模块 的 Makefile 文件 编写 方法 和 
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4. Í Linux 内 核 模块 简介 


Linux 内 核 的 整体 结构 已 经 非常 庞大 ， 而 其 包含 的 组 件 也 非常 多 。 我 们 怎样 把 需要 的 部 分 都 
包含 在 内 核 中 呢 ? 

一 种 方法 是 把 所 有 需要 的 功能 都 编译 到 Linux 内 核 。 这 会 导致 两 个 问题 ， 一 是 生成 的 内 核 会 
很 大 ， 二 是 如 果 我 们 要 在 现 有 的 内 核 中 新 增 或 删除 功能 ， 将 不 得 不 重新 编译 内 核 。 

有 没有 一 种 机 制 使 得 编译 出 的 内 核 本 身 并 不 需要 包含 所 有 功能 ， 而 在 这 些 功能 需要 被 使 用 的 
时 候 ， 其 对 应 的 代码 被 动态 地 加 载 到 内 核 中 呢 ? 

Linux 提供 了 这 样 的 一 种 机 制 ， 这 种 机 制 被 称 为 模块 〈Module)。 模 块 具 有 这 样 的 特点 。 

e ”模块 本 身 不 被 编译 入 内 核 映像 ， 从 而 控制 了 内 核 的 大 小 。 

e 模块 一 旦 被 加 载 ， 它 就 和 内 核 中 的 其 他 部 分 完全 一 样 。 

为 了 使 读者 建立 对 模块 的 初步 感性 认识 ， 我 们 先 来 看 一 个 最 简单 的 内 核 模 块 “Hello World", 
如 代码 清单 4.1 所 示 。 
















































































































































































































































































代码 清单 4.1 个 最 简单 的 Linux 内 核 模 块 
include «limnux/jimit.h 
include «linux/module.h» 


static int hello init (void) 

printk(KERN INFO " Hello World enterate 
return 0; 

static void hello exit (void) 


printk(KERN INFO " Hello World exit*n "); 








module init(hello init); 
module exit(hello exit); 


COS SI OY CI UBS a NTA COE O ODIT OY rU GOV ES 


MODULE AUTHOR("Barry Song «21cnbaoGgmail.com»"); 
MODULE LICENSE("Dual BSD/GPL"); 

20 MODULE DESCRIPTION("A simple Hello World Module"); 
21 MODULE ALIAS("a simplest module"); 


do^ Tec (fj P B0] PLZ HUBS: PLEBS ER C. EER AX Dual. BSD/GPL 许可 权限 的 
声明 以 及 一 些 描述 信息 ， 位 于 本 书 配套 光盘 VirtualBox 虚拟 机 映像 的 /home/lihacker/develop/ 
svn/1dd6410-read-only/training/kernel/drivers/hello 目录 。 编 译 它 会 产生 helloko 目标 文件 ， 通 过 
“insmod ./hello.ko” 命 令 可 以 加 载 它 , 通过 “rmmod hello" MET URRE, JUST SG “Hello World 
enter", Emý "Hello World exit". 

内 核 模块 中 用 于 输出 的 函数 是 内 核 空间 的 printk0 而 非 用 户 空间 的 printty，printkO 的 用 法 和 
printf0) 基 本 相似 ， 但 前 者 可 定义 输出 级 别 。printk0 可 作为 一 种 最 基本 的 内 核 调试 手段 ， 在 Linux 
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驱动 的 调试 章节 中 将 详细 讲解 这 个 函数 。 
在 Linux 中 ， 使 用 Ismod 命令 可 以 获得 系统 中 加 载 了 的 所 有 模块 以 及 模块 间 的 依赖 关系 ， 例 如 ; 


















































Module Size Used by 
hello Ou (0) 

nls iso8859 1 JE2 (01927 A 

nis cp437 Je 6S6 1 
vfat 1$ Gu. il 

fat GU SMS. dh ECTE 




















Ismod 命令 实际 上 读 取 并 分 析 “/proc/modules” 文 件 ， 与 上 述 lsmod 命令 结果 对 应 的 “/proc/modules” 
文件 如 下 : 

linacker@lihacker-laptop:~/$ cat /proc/modules 

hello 9472 0 - Live 0xf953b000 

nls iso8859 1 12032 1 - Live Oxf950c000 


nls cp437 13696 = Live 0xf9561000 
vfat 18816 1 - Live 0xf94f3000 











内 核 中 己 加 载 模块 的 信息 也 存在 于 /sys/module 目录 下 ， 加 载 helloko 后 ， 内 核 中 将 包含 
/sys/module/hello 目录 ， 该 目录 下 又 包含 一 个 refent 文件 和 一 个 sections 目录 ， 在 /sys/module/hello 
目录 下 运行 “tree -a” 得 到 如 下 目录 树 : 


lihacker8lihacker-laptop:/sys/module/hello$ tree -a 
































-- holders 
cv. saure 
-- notes 
"cc. simone s eps » oa leel 
cuc aeree (ena. 
-- sections 
| 95 SS 
I eve 
|-- .gnu.linkonce.this module 
|-- .note.gnu.build-id 
| 9 lo m o Snell cL 
| 9—- cxi I9 
ls Syris 
二 
Ec eed Sn 





3 directories, 12 files 
modprobe 命令 比 insmod 命令 要 强大 ， 它 在 加 载 某 模块 时 ， 会 同时 加 载 该 模块 所 依赖 的 其 他 
模块 。 使 用 modprobe 命令 加 载 的 模块 若 以 “modprobe -r filename" 117; IREN ERAS E] ES 38] ER Fc (c 3t 
的 模块 。 
使 用 modinfo < 模块 名 > 命令 可 以 获得 模块 的 信息 ， 包 括 模块 作者 、 模 块 的 说 明 、 模 块 所 支持 
的 参数 以 及 vermagic: 


lihacker@lihacker-laptop: ~ /develop/svn/ldd6410-read-only/training/kernel/drivers/ 
hello$ modinfo hello.ko 

































































filename: hello.ko 

alias: a simplest module 
description: A simple Hello World Module 
license: Dual BSD/GPL 
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author: Barry Song «21cnbaoGgmail.com» 

Ssrcversion: 3FE9BOFBAFDD565399B9C05 

depends: 

vermagic: 2.6.28-11-generic SMP mod unload modversions 586 





Linux 内 核 模块 程序 结构 


一 个 Linux 内 核 模 块 主要 由 如 下 几 个 部 分 组 成 。 








(1) 模块 加 载 函数 〈 一 般 需 要 )。 


M, 














本 模块 的 相关 初始 化 工作 。 
(2) 模块 卸载 函数 一 般 需要 )。 








MZ, 











相反 的 功能 。 
(30 模块 许可 证 声明 (必须 )。 





























将 收 到 内 核 被 污染 ” Ckerneltainted) 的 警告 。 
在 Linux 2.6 内 核 中 ， 可 接受 的 LICENSE 





























当 通 过 insmod 或 modprobe 命令 加 载 内 核 模块 时 ， 模 块 的 加 载 函数 会 自动 被 内 核 执 行 ， 完 成 














当 通 过 rmmod 命令 卸载 某 模块 时 ， 模 块 的 卸载 函数 会 自动 被 内 核 执行 ,完成 与 模块 外 载 函 数 





许可 证 (LICENSE) 声明 描述 内 核 模块 的 许可 权限 ， 如 果 不 声明 LICENSE， 模 块 被 加 载 时 ， 





包括 “GPL” “GPL v2". “GPL and additional rights ". 


“Dual BSD/GPL", “Dual MPL/GPL" 418 “Proprietary” 
大 多 数 情 况 下 ， 内 核 模块 应 遵循 GPL 兼容 许可 权 。Linux 2.6 内 核 模块 最 常见 的 是 以 
MODULE_LICENSE( "Dual BSD/GPL" ) 语 句 声明 模块 采用 BSD/GPL 双 LICENSE。 











(4) 模块 参数 〈 可 选 )。 


模块 参数 是 模块 被 加 载 的 时 候 可 以 被 传递 给 它 的 值 ， 它 本 身 对 应 模块 内 部 的 全 局 变量 。 








(5) 模块 导出 符号 〈 可 选 )。 


















































pil 





















































内 核 模 块 可 以 导出 符号 (symbol， 对 应 于 函数 或 变量 )， 这 样 其 他 模块 可 以 使 用 本 模块 中 的 变 


量 或 函数 。 
(6) 模块 作者 等 信息 声明 〈 可 选 )。 


4.3 onn 


mi 















































Linux 内 核 模块 加 载 函数 一 般 以 __init 标识 声明 ， 典 型 的 模块 加 载 函数 的 形式 如 代码 清单 4.2 


代码 清单 4.2 ”内 核 模块 加 载 函数 


所 示 。 
JL Sretko ae iue nieke lt Sa aE WNE cal ona: (AOL) 
2 { 
3 /* 初始 化 代码 */ 
4 } 
3 module init(initialization function); 
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模块 加 载 函 数 必须 以 “module_init( 函 数 名 )” 的 形式 被 指定 。 它 返回 整 型 值 ， 知 初始 化 成 功 ， 
应 返回 0。 而 在 初始 化 失败 时 ， 应 该 返回 错误 编码 。 在 Linux 内 核 里 ， 错 误 编码 是 一 个 负 值 ， 在 
<linux/errmno.h> 中 定义 ， 包 含 -ENODEV、-ENOMEM 之 类 的 符号 值 。 总 是 返回 相应 的 错误 编码 是 
种 非常 好 的 习惯 ， 因 为 只 有 这 样 ， 用 户 程序 才 可 以 利用 perror 等 方法 把 它们 转换 成 有 意义 的 错误 






































































































































































































































信息 字符 串 。 
在 Linux 2.6 内 核 中 ,可 以 使 用 request_module(const char *fmt, ...) 函 数 加 载 内 核 模块 ， 驱 动 开 
发 人 员 可 以 通过 调用 
request module (module name); 
或 
request module ("char-major-%d-%d", MAJOR (dev), MINOR (dev)); 
这 种 灵活 的 方式 加 载 其 他 内 核 模块 。 


























在 Linux 中 ， 所 有 标识 为 ”init 的 函数 在 连接 的 时 候 都 放 在 .init.text 这 个 区 段 内 ， 此 外 ， 所 有 
Hj init 函数 在 区 段 .initcallinit 中 还 保存 了 一 份 函数 指针 ， 在 初始 化 时 内 核 会 通过 这 些 函 数 指针 
WARE int 函数 ， 并 在 初始 化 完成 后 ， 释 放 init 区 段 〈 包 括 .init.text、.initcallinit 等 )。 
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Linux 内 核 模块 加 载 函 数 一 般 以 __exit 标识 声明 ， 典 型 的 模块 卸载 函数 的 形式 如 代码 清单 4.3 























































































































所 示 。 
代码 清单 4.3 ”内 核 模 块 和 卸载 函数 
1L Static void | exit cleanup function (void) 
2 ( 
3 /* TFERUNRS */ 
4 ] 
5 module exit(cleanup function); 


AREE PLU BEER ED BIER UT o POR EEE, DL " module exit(P& 2I)". KIA 
式 来 指定 。 
通常 来 说 ， 模 块 卸 载 函数 要 完成 与 模块 加 载 函数 相反 的 功能 ， 如 下 所 示 。 
e ” 若 模块 加 载 函 数 注册 了 XXX， 则 模块 和 卸载 函数 应 该 注销 XXX。 
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e CESONSOEAXS HS S A WEARS ER UNDERUA VIE o 
e 若 模 块 加 载 函数 申请 了 硬件 资源 CH DMA 通道 、IO 端口 和 UO 内 存 等 ) 的 占用 ， 
则 模块 抒 载 函 数 应 释放 这 些 硬件 资源 。 

e 若 模 块 加 载 函 数 开 启 了 硬件 ， 则 伸 载 函数 中 一 般 要 关闭 之 。 

和 __init 一 样 ，__exit 也 可 以 使 对 应 函数 在 运行 完成 后 自动 回收 内 存 。 实 际 上 ，__init 和 __exit 
都 是 宏 ， 其 定义 分 别 为 : 

define __init 有 

和 

ifdef MODULE 

define | exit - attribute. (Section (M erit toxrt ry 

else 
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#define _ exit -attribute Sed -attribute -. (section (tv exit. text))} 
#endif 

数据 也 可 以 被 定义 为 ”initdata 和 ”_exitdata， 这 两 个 宏 分 别 为 : 

#define __ initdata Att vi Gon wt ni ty 

和 

#define __exitdata tite i L (« (C. Section tt Aata ) ) ) 





Te 


我 们 可 以 用 “module param( 参 数 名 ,参数 类 型 ,参数 读 / 写 权限 )” 为 模块 定义 一 个 参数 ， 例 如 下 
列 代码 定义 了 1 个 整 型 参数 和 1 个 字符 指针 参数 : 


static char *book name - " dissecting Linux Device Driver "; 








static int num = 4 000; 
module param(num, int, S IRUGO); 
module param(book name, charp, S IRUGO); 


在 装载 内 核 模块 时 ， 用 户 可 以 向 模块 传递 参数 ， 形 式 为 “insmode (或 modprobe) 模块 名 参 
数 名 = 参数 值 ”， 如 果 不 传递 ， 参 数 将 使 用 模块 内 定义 的 缺 省 值 。 

参数 类 型 可 以 是 byte、short、ushort、int、uint、long、ulong、charp《 字 符 指 针 )、bool 3X invbool 
(布尔 的 反 ), 在 模块 被 编译 时 会 将 module_param 中 声明 的 类 型 与 变量 定义 的 类 型 进行 比较 , 判断 
是 否 一 致 。 

模块 被 加 载 后 ， 在 /sys/module/ 目 录 下 将 出 现 以 此 模块 名 命名 的 目录 。 当 “参数 读 / 写 权限 ”为 0 
时 ， 表 示 此 参数 不 存在 sysfs 文件 系统 下 对 应 的 文件 节点 ， 如 果 此 模块 存在 “参数 读 / 写 权 限 ” 不 为 0 
的 命令 行 参数 ， 在 此 模块 的 目录 下 还 将 出 现 parameters 目录 ， 包 含 一 系列 以 参数 名 命名 的 文件 节点 ， 
这 些 文件 的 权限 值 就 是 传 入 module_param0 的 “参数 读 / 写 权 限 ” 而 文件 的 内 容 为 参数 的 值 。 

除 此 之 外 ， 模 块 也 可 以 拥有 参数 数组 ， 形 式 为 “module_param_array( 数 组 名 ,数组 类 型 ,数组 长 ,参数 
读 / 写 权限 )” 从 2.6.0—2.6.10 版 本 ， 需 将 数组 长 变量 名 赋 给 “数组 长 ” 从 2.6.10 版 本 开始 ， 需 将 数组 
长 变量 的 指针 赋 给 “数组 长 ” 当 不 需要 保存 实际 输入 的 数组 元 素 个 数 时 ， 可 以 设置 “数组 长 ”为 NULL。 

运行 insmod 或 modprobe 命令 时 ， 应 使 用 逗号 分 隔 输 入 的 数组 元 素 。 

现在 我 们 定义 一 个 包含 两 个 参数 的 模块 (如 代码 清单 44， 位 于 虚拟 机 /home/lihacker/ 
develop/svn/1dd6410-read-only/training/kernel/drivers/param 目录 )， 并 观察 模块 加 载 时 被 传递 参数 和 
不 传递 参数 时 的 输出 。 










































































































































































































































































RAE AA TESTATOR 
finclude «linux/init.h» 
#include <linux/module.h> 
MODULE_LICENSE ("Dual BSD/GPL"); 


static char *book_name = "dissecting Linux Device Driver"; 
Static int num - 4 000; 


static int book init (void) 
( 
0 printk(KERN INFO " book name:$sMn",book name); 
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“/var/log/messages” 


e_param (num, 
e param(book name, 


fT 


static void book exit (void) 


(e amati Ook AEE p 
e exit(book exit); 


pnto S IG 


Sharp a 


“insmod bookko” 命 令 加 




















志文 件 可 以 看 





printk(KERN INFO " book num:$dMn",num); 
return 0; 


printk(KERN INFO " Book module exitWn "); 


IRUGO); 





EE 


dX. HIN H 
到 内 核 的 输出 : 


MODULE AUTHOR ("Barry Song «21cnbaoG8gmail.com»"); 
MODULE DESCR 
MODULE VERSION("V1.0"); 


对 上 述 模块 运 





上 都 为 模块 内 的 默认 值 ， 


PTION("A simple Module for testing module params"); 























[rootQ(localhost driver study]# tail -n 2 /var/log/messages 


dU eT s 
dul 2 Oe Oe 

















JP z4 
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10 


localhost kernel: 
localhost kernel: 


«6» book name:dissecting Linux Device Driver 
book num:4 000 


“insmod book.ko book name-'GoodBook' num-5 000" «mH, 4H 














的 是 











EE 


[root8(localhost driver study]# tail -n 2 /var/log/messages 


Jul 2 01:06:21 localhost kernel: 
Jul 2 01:06:21 localhost kernel: 


4.6 ens 


Linux 2.6 的 “/proc/kallsyms” 文 件 对 应 着 






































模块 可 以 使 





]ü rx 





EXPORT SYMBOL( 


Ar E 


(符号 名 ) ; 


Ar 


EXPORT SYMBOL GPL (符号 名 | 





导出 的 符号 将 可 以 被 
E GPL 许可 权 的 模块 。 代 码 清单 4.5 2618 I — 7 Sed 














HR 











其 他 模块 使 用 ， 使 
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(这 些 导 
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DO ug UON, Uus Go B. des 


} 
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出 符号 


return atp; 


出 符号 到 内 核 符号 表 : 


— 
X Lu 


CERE, MAENT} 





A 




















前 声明 一 下 


<6> book name:GoodBook 
book num:5 000 











货 示 )。 


即 可 。 
出 整数 加 、 减 运算 函数 符号 的 内 核 模块 








EXPORT SYMBOL GPL()H 


代码 清单 4.5 ”内 核 模块 中 的 符号 导出 


finclude «linux/init.h» 
#include <linux/module.h> 
MODULE LICENSE ("Dual BSD/GPL") 


int add integar(int a,int b) 


IOS aiue gesUlo) i etre ne vex, bine Jo) 


TET 


通过 查看 


j 户 传递 


及 符号 所 在 的 内 存 地 址 。 


适 








Linux 内 核 模 块 


O00 


return a-b; 


} 


EXPORT SYMBOL (add integar); 
EXPORT SYMBOL(sub integar); 


从 “/proc/kallsyms ”文件 中 找 出 add integar. sub integar 相关 信息 : 
root@localhost driver study]# cat /proc/kallsyms | grep integar 


2 
S 
4 
5 
6 























(CS IES0) a  Jemexeio cxolel- aun EENE [export] 
c886f058 r  kstrtab add integar [export] 
c886f070 r  ksymtab add integar [export] 
c886f054 r  kcrctab sub integar [export] 
c886f064 r  kstrtab sub integar [export] 
c886f078 r  ksymtab sub integar [export] 
c886f000 T add integar [export] 

c886f00b T sub integar [export] 

13db98c9 a crc sub integar [export] 
el626dee a crc add integar [export] 





模块 声明 与 描述 


在 Linux 内 核 模 块 中 ， 我 们 可 以 用 MODULE AUTHOR, MODULE DESCRIPTION., 
MODULE VERSION. MODULE DEVICE TABLE. MODULE ALIAS 分 别 声明 模块 的 作者 、 描 
述 、 版 本 、 设 备 表 和 别名 ， 例 如 : 


MODULE AUTHOR (author); 

MODULE DESCRIPTION (description); 
MODULE VERSION (version string); 
MODULE DEVICE TABLE(table info); 
MODULE ALIAS (alternate name); 


对 于 USB. PCI 等 设备 驱动 ， 通 常会 创建 一 个 MODULE DEVICE TABLE. ZH iz Jp 
所 支持 的 设备 ， 如 代码 清单 4.6 所 示 。 


代码 清单 4.6 ”驱动 所 支持 的 设备 列表 
1 /* 对 应 此 驱动 的 设备 表 */ 

2 static struct usb device id skel table [] =: ( 
3 ( USB DEVICE(USB SKEL VENDOR ID, 

4 USB SKEL PRODUCT ID) I, 

5 CO) /* RAR */ 
6 
3 
8 
























































hs 









































MODULE DEVICE TABLE (usb, skel table); 
此 时 ， 并 不 需要 读者 理解 MODULE DEVICE TABLE 的 作用 ， 后续 相关 章节 会 有 详细 


E 


Linux 2.4 内 核 中 ， 模 块 自 身 通过 MOD INC USE COUNT. MOD DEC USE COUNT X% 
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管理 自己 被 使 用 的 计数 。 
Linux 2.6 内 核 提 供 了 模块 计数 管理 接口 try module_get(&module) 和 module put (&module)， 从 
而 取代 Linux 2.4 内 核 中 的 模块 使 用 计数 管理 宏 。 模 块 的 使 用 计数 一 般 不 必 由 模 块 自身 管理 ， 而 且 
模块 计数 管理 还 考虑 了 SMP 5 PREEMPT 机 制 的 影响 。 







































































































































































int try module get(struct module *module); 

该 函数 用 于 增加 模块 使 用 计数 ; 若 返 回 为 0， 表 示 调 用 失败 ， 和 希望 使 用 的 模块 没有 被 加 载 或 
正在 被 卸载 中 。 

void module put(struct module *module); 

该 函数 用 于 减少 模块 使 用 计数 。 

try module get (与 module putO 的 引入 与 使 用 与 Linux 2.6 内 核 下 的 设备 模型 密切 相关 。Linux 
2.6 内 核 为 不 同类 型 的 设备 定义 了 struct module *owner 域 ， 用 来 指向 管理 此 设备 的 模块 。 当 开始 
使 用 某 个 设备 时 ， 内 核 使 用 try_module_get(dev->owner) 去 增加 管理 此 设备 的 owner 模块 的 使 用 计 
数 ， 当 不 再 使 用 此 设备 时 ， 内 核 使 用 module_put(dev->owner) 减 少 对 管理 此 设备 的 owner 模块 的 
使 用 计数 。 这 样 ， 当 设备 在 使 用 时 ， 管 理 此 设备 的 模块 将 不 能 被 秃 载 。 只 有 当 设 备 不 再 被 使 用 时 ， 
模块 才 允 许 被 凶 载 。 

在 Linux 2.6 内 核 下 ， 对 于 设备 驱动 工程 师 而 言 ， 很 少 需 要 亲自 调用 try module get() 与 
module_put()， 因 为 此 时 开发 人 员 所 写 的 驱动 通常 为 支持 某 具 体 设备 的 owner 模块 ， 对 此 设备 owner 
模块 的 计数 管理 由 内 核 里 更 底层 的 代码 如 总 线 驱 动 或 是 此 类 设备 共用 的 核心 模块 来 实现 ， 从 而 简 
化 了 设备 驱动 开发 。 


4.9 sss 


我 们 可 以 为 代码 清单 4.1 的 模板 编写 一 个 简单 的 Makefile: 


KVERS = $(shell uname -r) 



















































































































































































































































































































































































































































































































































































# Kernel modules 
obj-m += hello.o 


4 Specify flags for the module compilation. 
TEXTRA CFLAGS--g -00 


build: kernel modules 


kernel modules: 
make -C /lib/modules/$(KVERS)/build M-$(CURDIR) modules 


clean: 
make -C /lib/modules/$(KVERS)/build M-$(CURDIR) clean 


该 Makefile 文件 应 该 与 源 代码 hello.c 位 于 同一 目录 ， 开 启 其 中 的 EXTRA. CFLAGS-g -00 
可 以 得 到 包含 调试 信息 的 hello.ko 模块 。 运 行 make 命令 得 到 的 模块 可 直接 在 PC 上 运行 。 
如 果 一 个 模块 包括 多 个 .c 文件 (如 fel.c、file2.c)， 则 应 该 以 如 下 方式 编写 Makefile: 
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obj 
modulename-objs 


使 用 模块 绕 开 GPL 


对 于 企业 自己 编写 的 驱动 等 内 核 


-m := modulename.o 
:= filel.o file2.o 






































业 在 产品 
操作 系统 支持 模块 ， 需 要 完成 如 下 工作 。 
译 时 应 该 选 上 “可 以 加 载 模块 ”， 捞 入 式 产 品 一 







































































P ORE sts 
是 供 对 应 的 源 代码 ， 为 了 使 公司 产品 所 使 用 l 











各 我 们 编译 的 内 核 模 块 .ko 文件 应 该 放置 在 目 


牛 系统 中 应 该 包含 了 支持 新 内 
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简单 的 方法 是 修改 
CUM ARIS BEER 











但 是 
加 载 
if 


E. 




















本 章 主 
函数 以 及 一 系 


讲解 了 Linux 内 核 模块 的 概念 和 
组 成 ， idu Deus 


基本 的 编 
































Xz 


EFF 





重启 Linux, 但 是 如 果 编 译 为 模 所 

















Ide 在 
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标 文件 站 
核 的 insmod, lsmod. rmmod 等 工具 


需要 建立 模块 间 依赖 关系 ， 所 以 modprobe 可 以 不 要 ， 一 





























k, lll insmod xxx.ko. 
中 应 该 加 载 模块 ， 在 租 入 式 产 品 Linux 的 启动 过 程 
启动 过 程 的 rc 脚本 ， 

















增加 insmod /.../xxx.ko 

















通常 修改 etc/init.d/rceS 文件 。 





























程 方法 
也 可 以 导出 名 
， 因 此 ， 
RERO I tr ERU EE 》 
mas 
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本 章 导读 
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由 于 字符 设备 和 块 设备 都 良好 地 体现 了 “一 切 都 是 文件 ”的 设计 思想 ， 








掌握 Linux 文件 系统 、 设 备 文件 系统 的 知识 就 显得 相当 重要 了 。 















































首先 ， 驱 动工 程 师 编写 的 驱动 最 终 通 











过 操作 系统 的 文件 操作 系统 调用 

















或 C 库 函数 (本 质 也 基于 系统 调用 ) 被 访问 , 而 设备 驱动 的 结构 最 终 也 是 

















为 了 迎合 提供 给 应 用 程序 员 的 API。 
























































其次 ， 驱 动工 程 师 在 设备 驱动 中 不 可 避免 地 会 与 设备 文件 系统 打 交 





道 ， 从 Linux 2.4 内 核 的 devfs 文件 系统 到 目前 Linux 2.6 基于 sysfs 的 udev 





文件 系统 。 


























操作 的 编程 方法 。 








5.2 节 分 析 了 Linux 文件 系统 的 目录 结构 ， 简 身 


5.1 节 讲 解 了 通过 Linux API 和 C 库 函 数 在 






































j 户 空间 进行 Linux 文件 
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介绍 了 Linux 内 核 中 


文件 系统 的 实现 ， 并 给 出 了 文件 系统 与 设备 驱动 的 关系 。 











5.3 节 和 5.4 节 分 别 讲解 Linux 2.4 内 核 的 devfs 和 Linux 2.6 所 采用 的 


udev 设备 文件 系统 ， 并 分 析 了 两 者 的 














区 别 。 





5.5 节 讲 解 了 LDD6410 的 SD 4 
JE y 
Bi UL 。 





FAI NAND 分 区 和 文件 系统 的 使 用 



































5.1.1 





及 创建 、 打 开 、 读 写 和 关闭 文件 。 





1. 创建 


Linux 文件 操作 


文件 操作 系统 调用 
Linux 的 文件 操作 系统 调用 











(在 Windows 编程 领域 ， 














T 








int creat(const char *filename, mode t mode); 


参数 mode 指定 新 建文 件 的 存 取 权 限 , 它 同 umask 一 起 决定 文件 的 最 终 权 限 (mode&umask )， 



































































































































Linux 文件 系统 与 设备 文件 系统 





习惯 称 操作 系统 提供 的 接 





口 为 APD 涉 























































































































































































































































































































其 中 umask 代表 了 文件 在 创建 时 需要 去 掉 的 一 些 存 取 权 限 。umask 可 通过 系统 调用 umask0 来 改变 : 
int umask(int newmask); 

该 调用 将 umask 设置 为 newmask， 然 后 返回 旧 的 umask， 它 只 影响 读 、 写 和 执行 权限 。 

2. 打开 

int open(const char *pathname, int flags); 

int open(const char *pathname, int flags, mode t mode); 

open() 函 数 有 两 个 形式 ， 其 中 pathname 是 我 们 要 打开 的 文件 名 (包含 路 径 名 称 ， 缺 省 是 认为 
在 当前 路 径 下 面 )，flags 可 以 是 如 表 5.1 所 示 的 一 个 值 或 者 是 几 个 值 的 组 合 。 

表 5.1 文件 打开 标志 

标 志 $ X 
O RDONLY 以 只 读 的 方式 打开 文件 
O WRONLY 以 只 写 的 方式 打开 文件 
O RDWR 以 读 写 的 方式 打开 文件 
O_APPEND 以 追加 的 方式 打开 文件 
O_CREAT 创建 一 个 文件 
O_EXEC 如 果 使 用 了 O CREAT 而 且 文 件 已 经 存在 ， 就 会 发 生 一 个 错误 
O_NOBLOCK 以 非 阻 塞 的 方式 打开 一 个 文件 
O_TRUNC 如 果 文 件 已 经 存在 ， 则 删除 文件 的 内 容 

O_RDONLY, O_WRONLY, O RDWR 三 个 标志 只 能 使 用 任意 的 一 个 。 

如 果 使 用 了 O CREATE 标志 ， 则 使 用 的 函数 是 int open(const char *pathname,int flags,mode t 
mode); 这 个 时 候 我 们 还 要 指定 mode 标志 ， 用 来 表示 文件 的 访问 权限 。mode 可 以 是 如 表 5.2 所 列 
值 的 组 合 。 

表 5.2 文件 访问 权限 

标 5 $ X 
S IRUSR 户 可 以 读 
S IWUSR 户 可 以 写 
S_IXUSR 户 可 以 执行 





o06 





INUX 





Linux 设备 驱动 开发 详解 (第 2 版 ) 




































































































































































续 表 
标 5 *$ X 
S IRWXU 户 可 以 读 、 写 、 执 行 
S_IRGRP 组 可 以 读 
S IWGRP 组 可 以 写 
S IXGRP 组 可 以 执行 
S_IRWXG 组 可 以 读 、 写 、 执 行 
S_IROTH 其 他 人 可 以 读 
S IWOTH 其 他 人 可 以 写 
S IXOTH 其 他 人 可 以 执行 
S_IRWXO 其 他 人 可 以 读 、 写 、 执 行 
S ISUID 设置 用 户 执行 ID 
S_ISGID 设置 组 的 执行 ID 
除了 可 以 通过 上 述 宏 进行 “或 ”逻辑 产生 标志 以 外 ， 我 们 也 可 以 自己 用 数字 来 表示 ，Linux 


























] 5 个 数字 来 表示 文件 的 各 种 权限 : 第 一 位 表示 设置 用 户 ID; 第 二 位 表示 设置 组 ID; 第 三 位 表 
示 用 户 自己 的 权限 位 ; 第 四 位 表示 组 的 权限 ; 最 后 一 位 表示 其 他 人 的 权限 。 每 个 数字 可 以 取 1( 执 
行 权限 )、2〔 写 权限 )、4〔 读 权限 )、0 CIO 或 者 是 这 些 值 的 和 。 例 如 ， 要 创建 一 个 用 户 可 读 、 
可 写 、 可 执行 ， 但 是 组 没有 权限 ， 其 他 人 可 以 读 、 可 以 执行 的 文件 ， 并 设置 用 户 ID 人 位。 那么， 
我 们 应 该 使 用 的 模式 是 1〈 设 置 用 户 ID )、0 (不 设置 组 ID)、7 (1+2+4， 读 、 写 、 执 行 )、0 ( 没 
有 权限 )、5 (1+4， 读 、 执 行 ) 即 10 705: 

open("test", O CREAT, 10 705); 
上 述 语句 等 价 于 : 
opens OCREAT SL ERWXU O S IROTA: SS TXOTA MESES UIDES 


如 果 文 件 打开 成 功 ，open 函数 会 返回 一 个 文件 描述 符 ， 以 后 对 该 文件 的 所 有 操作 就 可 以 通过 















































































































































































































































































































































对 这 个 文件 描述 符 进行 操作 来 实现 。 
3. 读 与 
在 文件 打开 以 后 , 我 们 才 可 对 文件 进行 读 写 , Linux 中 提供 文件 读 写 的 系统 调用 是 read, write 














函数 : 
int read(int fd, const void *buf, size t length); 
int write(int fd, const void *buf, size t length); 


参数 buf 为 指向 缓冲 区 的 指针 ，length 为 缓冲 区 的 大 小 (以 字 节 为 单位 )。 函 数 read) 3E 
现 从 文件 描述 符 fd 所 指定 的 文件 中 读 取 length 个 字 节 到 buf 所 指向 的 缓冲 区 中 ,返回 值 为 实际 读 
取 的 字 节 数 。 函 数 write 实现 将 把 length 个 字 节 从 buf 指向 的 缓冲 区 中 写 到 文件 描述 符 fd 所 指向 
的 文件 中 ， 返 回 值 为 实际 写 入 的 字 节 数 。 
以 O_CREAT 为 标志 的 open 实际 上 实现 了 文件 创建 的 功能 ， 因 此 ， 下 面 的 函数 等 同 creat PR Rc: 
int open(pathname, O CREAT | O WRONLY | O TRUNC, mode); 
4. 定位 
对 于 随机 文件 ， 我 们 可 以 随机 地 指定 位 置 读 写 ， 使 用 如 下 函数 进行 定位 ; 


int lseek(int fd, offset_t offset, int whence); 
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Linux 文件 系统 与 设备 文件 系统 

















































































































































































































































































































lseek() 将 文件 读 写 指针 相对 whence 移动 offset 个 字 节 。 操 作成 功 时 ， 返 回 文件 指针 相对 于 文 
件 头 的 位 置 。 参 数 whence 可 使 用 下 述 值 : 

SEEK_SET: 相对 文件 开头 

SEEK_CUR: 相对 文件 读 写 指针 的 当前 位 置 

SEEK_END: 相对 文件 末尾 

offset 可 取 负 值 ， 例 如 下 述 调用 可 将 文件 指针 相对 当前 位 置 向 前 移动 5 个 字 节 

lseek(fd, -5, SEEK CUR); 

T Iseek 函数 的 返回 值 为 文件 指针 相对 于 文件 头 的 位 置 ， 因 此 下 列 调用 的 返回 值 就 是 文件 

的 长 度 : 

lseek(fd, 0, SEEK END); 

5. 关闭 

当 我 们 操作 完成 以 后 ， 我 们 要 关闭 文件 了 ， 只 要 调用 close 就 可 以 了 ， 其 中 fd 是 我 们 要 关闭 
的 文件 描述 符 : 

int close(int fd); 

例 程 : 编写 一 个 程序 ， 在 当前 目录 下 创建 用 户 可 读 写 文件 hello.txt， 在 其 中 写 入 “Hello, software 
weekly”， 关 闭 该 文件 。 再 次 打开 该 文件 ， 读 取 其 中 的 内 容 并 输出 在 屏幕 上 。 

解答 如 代码 清单 5.1。 



































代码 清单 5.1 






































Linux 文件 操作 用 户 空间 编程 “使 用 系统 调用 ) 


#include <sys/types.h> 
2 #include <sys/stat.h> 
3 $inoclude €fcntli.h» 
4 finclude <stdio.h> 
5) #define LENGTH 100 
6 main() 
1i ( 
8 int fd, len; 
9 char str[LENGTH]; 
0 
1 fd - open("hello.txt", O CREAT | O RDWR, S IRUSR | S IWUSR); /* 
2 创建 并 打开 文件 */ 
3 3s WECH ji 
4 writetfd, "Hello World', strlem("Hello World'"))z /* 
5 写 入 字符 串 */ 
6 close (fd); 
Y ] 
8 
9 fd - open("hello.txt", O RDWR); 
20 len = read(fd, str, LENGTH); /* 读 取 文件 内 容 */ 
2 str[len] -» 'WN0'; 
p pruntr(' ssim str 
23 Coser 
24 
编译 并 运行 ， 执 行 结果 为 输出 “Hello World". 
































5.1.2 C 库 文件 操作 


C 库 函 数 的 文 伯 











F 操 作 实 际 上 是 独立 于 
































具体 的 操作 系统 平台 的 , 不 管 是 在 DOS、Windows、Linux 
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还 是 在 VxWorks 中 都 是 这 些 函 数 : 
1. 创建 和 打开 


FILE *fopen(const char *path, const char *mode); 


















































































































































































































































fopen0 实 现 打 开 指定 文件 filename, KP) mode 为 打开 模式 ，C 库 函 数 中 支持 的 打开 模式 如 
表 5.3 所 示 。 
表 5.3 C 库 函 数 文件 打开 标志 
标 志 含 X 
r, rb 只 读 方 式 打 
w, wb 只 写 方式 打开 。 如 果 文 件 不 存在 ， 则 创建 该 文件 ， 和 否则 文件 被 截断 
a. ab 头 追加 方式 打开 。 如 果 文 件 不 存在 ， 则 创建 该 文件 
rh. rbb. rb 处 读 写 方式 打 
wH, wtb, wht 以 读 写 方式 打开 。 如 果 文 件 不 存在 时 ， 创 建新 文件 ， 否 则 文件 被 截断 
a+, atb, ab+ 头 读 和 追加 方式 打开 。 如 果 文 件 不 存在 ， 则 创建 新 文件 
其 中 b 用 于 区 分 二 进 制 文件 和 文本 文件 ， 这 一 点 在 DOS、Windows 系统 中 是 有 区 分 的 ， 但 
Linux 不 区 分 二 进 制 文件 和 文本 文件 。 
2. 读 写 
C 库 函 数 支 持 以 字符 、 字 符 串 等 为 单位 ， 支 持 按 照 某 种 格式 进行 文件 的 读 写 ， 这 一 组 函数 为 : 




















int fgetc(FILE *stream); 


int fputc(int c, FILE *stream); 

char *fgets(char *s, int n, FILE *stream); 
FILE *stream); 
ET 
int fscant (EILE "stream, const char 'tormat, 


sene oe (COn t ehan visi 


size t fread(void *ptr, size t size, size t n, 
size t fwrite (const void *ptr, size t size, si 


a stream 中 读 取 加 n 个 字段 ， 
[ 指 的 字符 数组 中 ， 返 回 实际 























每 个 字段 为 size 字 
已 读 取 的 字段 数 。 在 读 取 的 字段 数 小 于 


valk 
Scho 
FILE *stream); 


FILE *stream); 


并 将 读 取 的 字段 放 入 ptr 
时 ， 可 能 是 在 函数 调用 


ze t n, 
js 


BE , 

































































时 出 现 错误 ， once 的 结尾 。 所 以 要 通过 
write() 实 现 从 缓冲 区 ptr 所 指 的 数组 ， 

返回 实际 写 入 的 字段 数 。 
另外 ，C 库 函 数 还 提供 了 读 写 过 程 中 的 定位 能 力 ， 
int fgetpos(FILE *stream, fpos t *pos); 

int fsetpos(FILE *stream, const fpos t *pos); 
PILE *stream, 





调 


























H 





"n, 









































int fseek( 






























































3. 关闭 

利用 C 库 函 数 关闭 文件 依然 是 很 简单 的 操作 : 

int fclose (FILE *stream); 

例 程 ， 将 第 5.1.1 节 中 的 例 程 用 C. 库 函 数 来 实现 ， 如 代码 ; 
代码 清单 5.2 Linux 文件 操作 用 户 空间 

1 #include <stdio.h> 


d #define LENGTH 100 


把 n 个 字段 写 到 流 stream : 





] feof() 和 ferror() 来 判断 。 
， 每 个 字段 长 为 size 个 字 

















Xx ES p UBL: 


long offset, int whence); 























5-2 所 示 。 
编程 (使 用 C ERAM) 




















Linux 文件 系统 与 设备 文件 系统 


main() 
i 
PITE AEE 
char Str[LENGTH]; 














fd = fopen("hello.txt", "wt"); /* GJEJRITJTOCÓE */ 
as Ce) d 
fputs ("Hello World", fd); /* 写 入 字符 串 */ 
fclose(fd); 


(Co O00 CIS GE OT ET 





} 


Ed = EoDEn( ell ERE y VET 
fgets (str, LENGTH, fd); /* 读 取 文件 内 容 */ 
ee aeS Naa SEE 
fclose (fd); 
} 


5.2 EIST. 


5.2.1 Linux 文件 系统 目录 结 
进入 Linux JR H3& CBI */", Linux 文件 系统 的 入 口 ， 也 是 处 于 最 高 一 级 的 目录 ), 运行 “1s -1” 





OD c wav Cn SS Gh I| C 
























































命令 ， 看 到 Linux 包含 以 下 目录 。 
1. /bin 
包含 基本 命令 ， 如 ls cp, mkdir 等 ， 这 个 目录 中 的 文件 都 是 可 执行 的 。 
2. /sbin 

















包含 系统 命令 ， 如 modprobe、hwclock、ifconfig 等 ， 大 多 是 涉及 系统 管理 的 命令 ， 这 个 目录 
的 文件 都 是 可 执行 的 。 



































































































































3. /dev 

设备 文件 存储 目录 ， 应 用 程序 通过 对 这 些 文件 的 读 写 和 控制 就 可 以 访问 实际 的 设备 。 

4. /etc 

系统 配置 文件 的 所 在 地 ， 一 些 服 务 器 的 配置 文件 也 在 这 里 ， 如 用 户 账 号 及 密码 配置 文件 。 

busybox 的 启动 脚本 也 存放 在 该 目录 。 

5. Nib 

系统 库 文件 存放 目录 ， 如 LDD6410 包含 libe-2.6.1.s0、libpthread-2.6.1.so、libthread_db-1.0.so 等 。 
6. /mnt 




















/mnt 这 个 目录 一 般 是 用 于 存放 挂 载 储 存 设备 的 挂 载 目 录 的 ， 比 如 有 cdrom. 等 目录 。 可 以 
参看 /etc/fstab 的 定义 。 有 时 我 们 可 以 把 让 系统 开机 自动 挂 载 文 件 系 统 ， 把 挂 载 点 放 在 这 里 也 
是 可 以 的 。 

7. /opt 

opt 是 “可 选 ” 的 意思 ， 有 些 软件 包 会 被 安装 在 这 里 ， 例 如 ， 在 LDD6410 的 文件 系统 中 ， 
Qt/Embedded 就 存放 在 该 目录 。 
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8. /proc 
操作 系统 运行 时 ， 进 程 及 内 核 信息 〈 比 如 CPU、 硬 盘 分 区 、 内 存 信息 等 ) 存放 在 这 里 。/proc 
目录 为 伪 文 件 系统 proc 的 挂 载 目录 ，proc 并 不 是 真正 的 文件 系统 ， 它 存在 于 内 存 之 中 。 


















































































































































9. /tmp 

有 时 用 户 运 行程 序 的 时 候 ， 会 产生 临时 文件 ，/tmp 就 用 来 存放 临时 文件 的 。 

10. /usr 

这 个 是 系统 存放 程序 的 目录 ， 比 如 用 户 命令 、 用 户 库 等 。LDD6410 的 usr 包括 bin. sbin, lib 















































三 个 子 目 录 。usr/bin 中 包含 diff. which. who. rx. emp 等 ，usrsbin 中 包含 chroot、flash_eraseall、 
inetd 等 ，usr/lib 中 包含 libjpeg.so.62.0.0 等 。 


11. /var 
var 表示 的 是 变化 的 意思 ， 这 个 目录 的 内 容 经 常 变动 ， 如 /var 的 /var/log 目录 被 用 来 存放 系统 










































































12. /sys 

Linux 2.6 PZTS FER sysfs 文件 系统 被 映射 在 此 目录 。Linux 设备 驱动 模型 中 的 总 线 、 驱 动 
和 设备 都 可 以 在 sysfs 文件 系统 中 找到 对 应 的 节点 。 当 内 核 检 测 到 在 系统 中 出 现 了 新 设备 后 ， 内 核 
会 在 sysfs 文件 系统 中 为 该 新 设备 生成 一 项 新 的 记录 。 


5.2.2 Linux 文件 系统 与 设备 驱动 


图 5.1 所 示 为 Linux 中 虚拟 文件 系统 、 磁 盘 文 件 (存放 于 Ramdisk、Flash、ROM、SD F, 
盘 等 文件 系统 中 的 文件 也 属于 此 列 ) 及 一 般 的 设备 文件 与 设备 驱动 程序 之 间 的 关系 。 


应 用 程序 
系统 调用 














































































































7 
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| VES | file operations 


特殊 文件 磁盘 文件 g 设备 文件 


磁盘 驱动 其 他 设备 驱动 


其 他 设备 












图 5.1 文件 系统 与 设备 驱动 























应 用 程序 和 VES 之 间 的 接口 是 系统 调用 ， 而 VFS 与 磁盘 文件 系统 以 及 普通 设备 之 间 的 接口 
是 file operations 结构 体 成 员 函 数 ， 这 个 结构 体 包 含 对 文件 进行 打开 、 关 闭 、 读 写 、 控 制 的 一 系列 
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于 字符 设备 的 上 层 没有 磁盘 文件 系统 ， 所 以 字符 设备 的 file operations 成 员 函 数 就 直接 由 设 
备 驱动 提供 了 ， 在 稍 后 的 第 6 章 ， 将 会 看 到 file operations 正 是 字符 设备 驱动 的 核心 。 
而 对 于 块 存储 设备 而 言 ，ext2、fat、jffs2 等 文件 系统 中 会 实现 针对 VFS 的 file operations 成 
员 函 数 ， 设 备 驱 动 层 将 看 不 到 file operations 的 存在 。 磁 盘 文 件 系 统 和 设备 驱动 会 将 对 磁盘 上 文件 
的 访问 最 终 转换 成 对 磁盘 上 柱 面 和 扇 区 的 访问 。 
在 设备 驱动 程序 的 设计 中 ， 一 般 而 言 ， 会 关心 fle 和 inode 这 两 个 结构 体 。 
1. file 结构 体 
file 结构 体 代 表 一 个 打开 的 文件 (设备 对 应 于 设备 文件 )， 系 统 中 每 个 打开 的 文件 在 内 核 空 间 
都 有 一 个 关联 的 struct file。 它 由 内 核 在 打开 文件 时 创建 ， 并 传递 给 在 文件 上 进行 操作 的 任何 函数 。 
在 文件 的 所 有 实例 都 关闭 后 ， 内 核 释 放 这 个 数据 结构 。 在 内 核 和 驱动 源 代码 中 ，struct file 的 指针 
通常 被 命名 为 file 或 flp( 即 file pointer)。 代 码 清单 5.3 给 出 了 文件 结构 体 的 定义 。 


代码 清单 5.3 ”文件 结构 体 



























































































































































































































































I ele sh 

2 

9 union { 

4 Sr St Wen tit 

5 struct rcu head fu rcuhead; 
6 P 

7 struct dentry *f dentry; /* 与 文件 关联 的 目录 入 口 (dentry) 结构 */ 

8 Btruct vfsmount *f vfsmnt; 

9 struct file operations *f op; /* 和 文件 关联 的 操作 */ 

atomic t SNC OU 

unsigned int f flags;/*JX ftbi. "llo RDONLY. O NONBLOCK. O SYNC*/ 
mode t f mode; /* 文 件 读 / 写 模式 ，FMODE_READ 和 FMODE WRITE*/ 

loff t f pos; /* "BE H*/ 

struct fown struct f owner; 






































ms ncne seime 3E quel 3E Gpuel] 
struct file ra state f ra; 


DO qp Oy OI aso o INS ger oc 


unsigned long f version; 





«o 


CU 























21  /* tty 驱动 需要 ， 其 他 的 也 许 需要 */ 
22 void *private data; /* 文 件 私 有 数据 */ 


24 struct address space *f mapping; 
DOS 


文件 读 / 写 模式 mode. fao f flags 都 是 设备 驱动 关心 的 内 容 ， 而 私有 数据 指针 private data 
在 设备 驱动 中 被 广泛 应 用 ， 大 多 被 指向 设备 驱动 自 定 义 用 于 描述 设备 的 结构 体 。 
驱动 程序 中 经 常会 使 用 如 下 类 似 的 代码 来 检测 用 户 打 开 文 件 的 读 写 方式 : 


if (file-»f mode & FMODE WRITE) {/* 用 户 要 求 可 写 */ 









































































































































H 
if (file->f_mode & FMODE READ) {/* 用 户 要 求 可 读 */ 





























下 面 的 代码 可 用 于 判断 以 阻塞 还 是 非 阻 塞 方式 打开 设备 文件 : 
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100 


if (file-»f flags & O NONBLOCK) /* 非 阻 塞 */ 
1 
/* BH3E */ 


else 
pr debug("open: blockingNn"); 


2. inode 结构 体 





VFS inode 包含 文件 访问 权限 、 属 主 、 组 、 大 小 、 生 成 时 间 、 访 问 时 间 、 最 后 修改 时 间 等 信 




































































息 。 它 是 Linux 管理 文件 系统 的 最 基本 单位 ， 也 是 文件 系统 连接 任何 子 目 录 、 文 件 的 桥梁 ，inode 


结构 体 的 定义 如 代码 清单 5.4 所 示 。 
代码 清单 5.4 inode 结构 体 
1 struct inode 
2 sis 
3 umode t i mode; /* inode 的 权限 */ 
4 uid t i uid; /* inode 拥有 者 的 id */ 
5 gid t i gid; /* inode 所 属 的 群 组 ia */ 
6 dev t i rdev; /* 若是 设备 文件 ， 此 字段 将 记录 设备 的 设备 号 */ 
7 loff t i size; /* inode 所 代表 的 文件 大 小 */ 
8 
9 struct timespec i atime; /* inode 最 近 一 次 的 存 取 时 间 */ 
























































的 Blo6ek 数 ,一 个 block 为 512 byte*/ 


0 struct timespec i mtime; /* inode 最 近 一 次 的 修改 时 间 */ 
1 struct timespec i ctime; /* inode 的 产生 时 间 */ 
2 
3 unsigned long i blksize; /* inode 在 做 I/0 时 的 区 块 大 小 */ 
4 unsigned long i blocks; /* inode 所 使 用 
5 
6 struct block device *i bdev; 
F /* 若 是 块 设备 ， 为 其 对 应 的 block_device 结构 体 指 针 */ 
8 struct cdev *i cdev;  ”/* 若 是 字符 设备 ， 为 其 对 应 的 cdev 结构 体 指针 */ 
9 
ZONE 


对 于 表示 设备 文件 的 inode 结构 ，i_rdev 字段 包含 设备 纺 











编号 和 次 设备 编 
中 获得 主 设备 号 和 次 设备 号 ; 


nsigned int iminor(struct inode *inode); 
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nsigned int imajor(struct inode *inode); 

















Character devices: 
mem 

pty 

ttyp 
/dev/vc/0 

tty 

/dev/tty 
/dev/console 
/dev/ptmx 


VCS 


(ex On (up (dup des sey (9. [RR dE 
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misc 


n 
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input 
sg 

fb 
T28 pto 


N N 
i£ o PE 




















Fo Linux 2.6 设备 编号 分 为 主 设备 











号 , 前 者 为 dev t 的 高 12 位 , 后 者 为 dev t 的 低 20 位 。 下列 操作 用 于 从 一 个 inode 





查看 /proc/devices 文件 可 以 获知 系统 中 注册 的 设备 ， 第 1 列 为 主 设备 号 ， 第 2 列 为 设备 名 ， 如 : 


"i 

















Le joue 

171 ieeel1394 
180 usb 

189 usb device 


Block devices: 
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同类 的 设备 一 般 使 
因为 同一 驱动 可 文 





1 ramdisk 
2X 
Bos 
9 md 
22 idel 
查看 /dev 目录 可 以 获知 系统 中 包含 的 设备 文件 ， 日 期 的 前 两 列 给 出 了 对 应 设备 的 主 设备 号 和 
次 设备 号 : 
CIW-rw---- dl reot uucp 4, 64 Jan 30 2003 /dev/ttySO 
brw-rw---- l xoot disk 8, 0 Jan 30 2003 /dev/sda 
主 设备 号 是 与 驱动 对 应 的 概念 ， 同 一 类 设备 一 般 使 用 相同 的 主 设备 号 ， 不 
用 不 同 的 主 设备 号 〈 但 是 也 不 排除 在 同一 主 设备 号 下 包含 有 一 定 差 异 的 设备 )。 
持 多 个 同类 设备 ， 因 此 用 次 设备 号 来 描述 使 用 该 驱动 的 设备 的 序号 ， 序 号 一 般 从 0 开始 。 
内 核 Documents 目录 下 的 devices.txt 文件 描述 了 Linux 设备 号 的 分 配 情 况 ， 它 由 





Linux Assigned Names And Numbers Authority， 网 址 : http://www.lanana.org/) ?H£H?| 
中 的 主要 维 


Mathiasen (device(ganana.org) 
































AE 





devfs 〈 设 备 文件 系统 ) 是 | 















































护 者 。 











devfs 设备 文件 系统 


Linux 2.4 内 核 引 入 的 ， 引 入 时 被 许多 了 





























它 的 出 现 使 得 设备 驱动 程序 能 
































(1) 可 以 通 ; 

















(20 设备 驱动 程序 可 以 指定 设备 名 、 所 有 者 和 权限 


限 位 。 


(3) 不 再 需要 为 设备 驱动 程序 分 配 主 设备 号 以 及 处 理 次 设备 号 ， 在 程序 ! 
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Ej", Torben 














[ 程 师 给 予 了 高 度 评 价 ， 





主 地 管理 它 自 己 的 设备 文件 。 具 体 来 说 ，devfs 具有 如 下 优点 。 
才 程 序 在 设备 初始 化 时 在 /dev 目录 下 创建 设备 文件 ， 务 载 设备 时 将 它 删 除 。 
立 ， 用 户 空 间 程序 仍 可 以 修改 所 有 者 和 权 
































chrdev()f£ 3$ 0 主 设备 号 以 获得 

















可 用 

















驱动 程序 应 调用 下 面 这 些 
/* 创 建设 备 目 录 */ 


























可 以 











要 接 给 register_ 








的 主 设备 号 ， 并 在 devfs_register() 中 指定 次 设备 号 。 





























行 设备 文件 的 创建 和 删除 工作 。 





devte handle t devts mk dir(devfs handle ne 





/* 创 建设 备 文件 */ 





devfs handle t devfs register(devfs handle t dir, const char *name, unsigned 
int flags, unsigned int major, unsigned int minor, umode t mode, void *ops, 


void *info); 









































/* 撤 销 设 备 文件 */ 

void devfs unregister(devfs handle t de); 

在 Linux 2.4 RE GJ] Fer. DIERRE CELER E PL 2 OEM Tor OC TE Je M ED 
采用 并 值得 大 力 推 荐 的 好 方法 。 代 码 清单 5.5 给 出 了 一 个 使 用 devfs 的 例子 。 
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代码 清单 5.5 devfs 的 使 用 范例 




















Hi static devfs handle t devfs handle; 

2 Save due 0. LEE $exex aae (ve) 

E ( 

4 int ret; 

5 int i; 

6 /在 内 核 中 注册 设备 */ 

7 ret - register chrdev(XXX MAJOR, DEVICE NAME, &xxx fops); 
8 TETS EELO 

9 printk(DEVICE NAME " can't register major number\n"); 
0 return ret; 

1 } 

2 /* 创 建设 备 文件 */ 

3 devfs handle -devfs register(NULL, DEVICE NAME, DEVFS FL DEFAULT, 
4 SOCOMAIOR (05. [S RCHRA | S ausu || NS Gxexxoeeqxep, JE P 
5 Sh 

6 printk(DEVICE NAME " initializedNn"); 

9) return 0; 

9 jy 

9 

20 static void . exit xxx exit(void) 

2.4 { 

22 devfs unregister(devfs handle); /* 撤 销 设备 文件 */ 

23 unregister chrdev(XXX MAJOR, DEVICE NAME); /* 注 销 设备 */ 

24 ) 

25 

26. moduLesinit (Xe LiL E> 

27 module exit(xxx exit); 








代码 中 第 7 行 和 第 23 行 分 别 用 于 注册 和 注销 字符 设备 ， 使 用 的 register chrdev() 和 
unregister chrdev()fE Linux 2.6 内 核 中 虽然 仍然 被 支持 , 但 这 是 过 时 的 做 法 。 第 13 和 22 行 分 别 用 

















于 创建 和 删除 devfs 文件 


5.4 udev 





5.4.1 udev 与 devfs 的 区 别 








































































































ETE 
节点 。 


设备 文件 系统 

















尽管 devfs 有 这 样 和 









































最 终 被 抛弃 ，udev 取代 了 它 。Linux VFS 内 核 维护 者 Al Viro 指出 了 几 点 udev 取代 devfs 的 原因 : 


那样 的 优点 ， 但 是 ,在 Linux 2.6 内 核 中 ，devfs 被 认为 是 过 时 的 方法 ， 









































C12. devfs 所 做 的 工作 被 确信 可 以 在 用 户 态 来 完成 。 
(2) devfs 被 加 入 内 核 之 时 ， 大 家 寄 望 它 的 质量 可 以 迎头 赶 上 。 



































G) devfs 被 发 现 了 一 些 可 修复 和 无 法 修复 的 bug. 









































(4) 对 于 可 修复 的 bug， 几 个 月 前 就 已 经 被 修复 了 ， 其 维护 者 认为 一 切 良 好 。 











(5) XT IB. Ff 











是 相当 长 一 段 时 间 以 来 没有 改观 了 。 




















(6) devfs 的 维护 














和 作者 对 它 感到 失望 并 且 已 经 停止 了 对 代码 的 维护 工作 。 















































Linux 内 核 的 两 位 贡 





献 者 ，Richard Gooch (devfs 的 作者 ) 和 Greg Kroah-Hartman (sysfs 的 了 
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要 作者 ) 就 devfs/udev 进行 了 激烈 的 争论 : 
Greg:Richard had stated that udev was a proper replacement for DevFS. 








Richard: Well, that's news to me! 


Linux 文件 系统 与 设备 文件 系统 


Greg: DevFS should be taken out because policy should exist in userspace and not in the kernel. 


Richard:SysFS, developed in large part by Greg, also implemented policy in the kernel. 


Greg: DevFS was broken and unfixable 


Richard: No proof. Never say never... 








ix BU RKG 











论 可 意译 如 下 : 





Greg: Richard 已 经 指 蝇 





Richard: Hj 
Greg: DevFS 
Richard: Hj 











, 


Greg: devfs (EEERT, 














应 该 下 课 ， 


我 听 说 ， 相 当 














r1 


H, udev 是 DevFS 恰当 的 蔡 代 品 。 
， 是 哪个 Richard 说 的 ? 我 怎么 不 知道 。 








因为 策略 应 该 





Richard: 呵呵 ， 没 证 据 ， 别 习 
在 Richard Gooch 和 Greg Kroah-Hartman 的 和 




















于 policy CRIK) ABEL 








FAIRE. Linux Wit! 














T 








制 是 做 某 样 事情 的 固定 的 步 奏 、 方 济 











定 的 ， 而 每 个 步 奏 


什么 devfs 位 于 内 核 空 间 ， 
下 面 举 一 个 通俗 的 例子 来 理解 
可 以 让 内 核 提 供 谈 恋爱 的 机 制 ，1 
核 空 间 。 因 为 恋爱 是 E 
以 根据 对 方 的 乡 





用 的 策 











sy 
A 
























































， 而 策略 就 是 每 
和 名 是 不 固定 的 。 机 和 
内 核 中 ， 不 应 该 实现 策略 。Richard Gooch 认为 ， 





ET HI 



































户 空间 而 不 是 内 核 空间 。 
大 部 分 由 Greg 完成 的 sysfs 也 在 内 核 ! 
也 不 稳定 。 








实现 了 策略 。 















































论 中 ，Greg Kroah-Hartman 使 用 的 理论 依据 就 在 
强调 的 一 个 基本 观点 是 机 制 和 策略 的 分 离 。 机 























个 步 奏 所 采取 的 不 同方 式 。 机 制 是 相对 
出 是 稳定 的 ， 而 策略 则 是 灵活 


i 
的 ， 因此 ， 在 Linux 
各 的 东西 应 该 被 移 到 用 户 空间 。 这 就 是 为 












































|] udev 确 P 移 





属于 策 ! 
用户 空间 的 



































内 


























原因 o 





Fudev 设计 的 出 发 点 。 以 谈 恋爱 为 例 ，Greg Kroah-Hartman 认为 ， 
是 不 能 在 内 核 空 间 限 制 


跟 谁 谈 恋爱 ， 不 能 把 谈 恋爱 的 策略 放 在 内 





























9 RU. 


的 ， 用 





























来 - 


























udev 完全 在 用 户 态 ] 





CE. AAHH 














命名 策略 、 权 限 控制 和 事件 处 
[ 作 。 热 插 拔 时 输出 到 sysfs 中 
性 格 、 籍 贯 等 )， 设 备 命名 策 


谁 和 谁 谈 恋爱 ， 


文件 节点 等 了 











CE, Fl 
I. EAS 


户 应 该 可 以 在 用 户 空 间 ! 
性 格 等 自由 选择 。 对 应 devfs 
第 2 个 相亲 的 女孩 被 命名 为 /dewgirll， 依 此 类 
样 的 : 不 管 


你 中 意 的 女孩 第 几 个 来 ， 


























实现 “萝卜 白菜 ， 各 有 所 爱 ” 的 理想 ， 














HJ 














ce 





言 ， 第 1 个 相亲 的 女孩 被 命名 为 /dev/girl0， 

















E. 而 在 月 


au 











RE 

















设备 














内 核 输出 到 














它 与 你 定义 的 
加 入 或 移 除 时 内 核 
He 

















户 空 间 实 现 的 udev 则 可 以 使 得 用 户 实 现 这 
规则 符合 ， 都 命名 为 /dev/mygirl ! 

所 发 送 的 热 插 拔 事件 Chotplug event 
位 于 /sys 的 sysfs 文件 系统 。udev 的 设备 





























SUNG 


此 ， 


fik, devfs 能 自动 加 载 对 应 的 双 


























于 udev 根据 系统 : 
































里 都 是 在 | 























而 udev 则 聪明 地 多 ， 
































在 使 
devfs 与 udev 


] udev 后 ，/dev H 





硬件 设备 的 ; 
录 下 就 会 只 


d 
[一 
ug 











包含 系统 中 真 了 





” 态 下 完成 的 














各 等 就 是 择偶 标准 。devfs 


只 





做 态 动态 更 新 设备 文件 ， 进 行 设备 文件 的 创建 和 删 
E 存 在 的 设备 了 。 




















的 另 一 个 显著 














区 别 在 于 : 














FH devfs， 





区 动 ， 而 udev 则 不 这 么 做 。 这 是 


的 设备 的 详细 信息 就 是 相亲 对 象 的 资料 (多 














， 它 利用 sysfs 中 的 信息 来 进行 创建 设备 
貌 、 年 龄 、 
是 个 览 脚 的 婚姻 介绍 所 ， 它 直接 指定 了 
户 ， 让 客户 根据 这 些 资料 去 选择 和 谁 


















































M, 





一 个 并 不 存在 的 /dev 节点 被 打开 的 时 
因为 udev 的 设计 者 认为 Linux 应 














该 在 设备 被 发 现 的 时 候 加 载 驱动 模块 ， 而 不 是 当 它 被 访问 的 时 候 。udev 的 设计 者 认为 devfs 所 
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提供 的 打开 /dev 节点 时 自动 加 载 驱动 的 功能 对 于 一 个 配置 正确 的 计算 机 是 多 余 的 。 系 统 中 所 有 
的 设备 都 应 该 产生 热 插 拔 事件 并 加 载 恰当 的 驱动 , 而 udev 能 注意 到 这 点 并 且 为 它 创建 对 应 的 设 
T E. 





5.4.2 sysfs 文件 系统 与 Linux 设备 模型 

Linux 2.6 的 内 核 引 入 了 sysfs 文件 系统 ，sysfs 被 看 成 是 与 proc、devfs 和 devpty 同类 别 的 文 
件 系统 ， 该 文件 系统 是 一 个 虚拟 的 文件 系统 ， 它 可 以 产生 一 个 包括 所 有 系统 硬件 的 层级 视图 ， 与 
提供 进程 和 状态 信息 的 proc 文件 系统 十 分 类 似 。 

sysfs 把 连接 在 系统 上 的 设备 和 总 线 组 织 成 为 一 个 分 级 的 文件 ， 它 们 可 以 由 用 户 空间 存 取 ， 向 
户 空 间 导 出 内 核 数据 结 构 以 及 它们 的 属性 。sysfs 的 一 个 目的 就 是 展示 设备 驱动 模型 中 各 组 件 的 
层次 关系 ， 其 顶级 目录 包括 block、device、bus、drivers、class、power 和 firmware。 
block 目录 包含 所 有 的 块 设 备 : devices 目录 包含 系统 所 有 的 设备 ， 并 根据 设备 挂 接 的 总 线 类 
















































































































































































型 组 织 成 层次 结构 ;bus 目录 包含 系统 中 所 有 的 总 线 类 型 ，drivers 目录 包括 内 核 中 所 有 已 注册 的 
设备 驱动 程序 ，class 目录 包含 系统 中 的 设备 类 型 (如 网 卡 设备 、 声 卡 设备 、 输 入 设备 等 )。 在 /sys 
目录 运行 tree 会 得 到 一 个 相当 长 的 树 型 目录 ， 下 面 摘 取 一 部 分 : 
cc Jouloxes 

c ECO 

—c inel) 


cc seen) 














































































































cu seen 


cc Joel 

= eisa 
|-- devices 
ye Gh LN 

-- ide 

-- ieeel1394 

c2 joreut 
|-- devices 
| H (9000 8 00 SOO SO — 5 57 554, e odekesuate ets, exer (001010) (00.7 (0010/0) 3 (00) c (00) (0) 
| cx (90/0018 (0)0) 5 ()10 (9) 5 5 5745 1 S00 5 )0)//0)0)0/0) & (0)0) c (0)1E (0) 
| cx (9000) (00)810)77 0 5 577 e ad a oy elevate. .019)0)9) (0/000) (00):(0) 7/8) 
Joa Giyas 

-- PCI IDE 
| m 
|-- new id 


Lum m 





Lele 
[== OOO CORO E > eV/OOO A OO: O 
Im 
ILC 
E uml 
c qeu aree 
=- pnp 
lS 





|-- devices 
Ücc Ole MAS 
|| e: has 
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| 9 quslo 
|-- usb-storage 
= SEs 

c (ues 

-m o Graphyros 

-- hwmon 

-- ieeel1394 

-- ieeel1394 host 

-- ieeel1394 node 

-- ieeel394 protocol 


scu ind 
-- mem 
cc gaude 
SANET 
=> Jo S 
|. 000000 
| |== orice => 
| | e (elon ee aba ies 
| !-- uevent 
TPeccODDDITME 
[== arcee > 
| opuatfincty 
!'-- uevent 


zm sesi device 

-- scsi generic 
-— deal host 
PERRON 

cc E 

-- usb device 
bst 

== ES 

-- devices 

ccs exeun. (0)0)0)(9) € (0)0) 

se 00007005007 
"cODOUSCDOTDT. 
--o0000:00:07. 
380101007100 (00/09 
m DODUTDUTDT. 
cc PatrOn 


us Trid ree 


—— dde s) 
"s chest 

ze QB002 

== jn 
SIT 








-- firmware 
-- kernel 

'-- hotplug seqnum 
-- module 

|== e 

| 2 enters 

| c. (olent 

|-- eisa bus 

[mr Ema 

|-- ide cd 


Linux 文件 系统 


od oed er Olen ee exea )0)0)0) - (09) 


./../../devices/pci0000:00/0000:00:01.0 


设备 文件 系统 








000 


105 


Linux 设备 驱动 开发 详解 (第 2 版 ) 





a Ld BOSI 
-- ieee1394 
-- md mod 
EE heus 
arr 
—c qoxeuepoxone. PO 
-- usb storage 
-- usbcore 
|-- parameters 
|| e rercnt 
V—n SecEions 
i sy ob root 
'-- parameters 





'-- force probe 
LE VAES 

Ie enis 

J ee ee 





UVES TONS 
!-- power 
ES 


在 /sys/bus 的 pci 等 子 目录 下 ， 又 会 再 分 出 drivers 和 devices 目录 , 而 devices 目录 中 的 文件 是 
对 /sys/devices 目录 中 文件 的 符号 链接 。 同 样 地 ，/sys/class 目录 下 也 包含 许多 对 /sys/devices 下 文件 
的 链接 。 如 图 5.2 所 示 ， 这 与 设备 、 驱 动 、 总 线 和 类 的 现实 状况 是 直接 对 应 的 ， 也 正 符合 Linux 2.6 
的 设备 模型 。 













































































图 5.2 Linux 设备 模型 


















































随 着 技术 的 不 断 进步 ， 系 统 的 拓扑 结构 越 来 越 复 杂 ， 对 智能 电源 管理 、 热 插 拔 以 及 即 插 即 用 
的 支持 要 求 也 越 来 越 高 ，Linux 2.4 内 核 已 经 难以 满足 这 些 需 求 。 为 适应 这 种 形势 的 需要 ，Linux 2.6 
内 核 开发 了 上 述 全 新 的 设备 、 总 线 、 类 和 驱动 环 环 相 扣 的 设备 模型 。 图 5.3 形象 地 表示 了 Linux 
驱动 模型 中 设备 、 总 线 和 类 之 间 的 关系 。 

大 多 数 情况 下 ，Linux 2.6 内 核 中 的 设备 模型 代码 会 作为 “幕后 黑手 ”处 理 好 这 些 关 系 ， 内 核 
的 总 线 级 和 其 他 内 核子 系统 会 完成 与 设备 模型 的 交互 ， 这 使 得 驱动 工程 师 几乎 不 需要 关心 设备 












































































































































































































































模型 。 
fr Linux 内 核 中 ,分 别 使 用 bus type. device driver 和 device 来 描述 总 线 、 驱 动 和 设备 ， 这 3 
个 结构 体 定 义 于 include/linux/device.h 头 文件 中 ， 其 定义 如 代码 清单 5.6 所 示 。 
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Linux 文件 系统 与 设备 文件 系统 


000 


水 果 类 





图 5.3 Linux 驱动 模型 中 设备 、 总 线 和 类 的 关系 


代码 清单 5.6 bus type. device driver 和 device 结构 体 


struct bus type 1 
const char *name; 
struct bus dttribute  *bus attrs; 
struct device attribute *dev attrs; 


T 

2 

E 

4 

5 struct driver attribute furwvosEEFST 

6 

7 int (*match) (struct device *dev, struct device driver *drv); 

8 int (*uevent) (struct device *dev, struct kobj uevent env *env); 
9 int (*probe) (struct device *dev); 

int (*remove) (struct device *dev); 


void (*shutdown) (struct device *dev); 


int (*suspend) (struct device *dev, pm message t state); 

int (*suspend late) (struct device *dev, pm message t state); 
int (*resume early) (struct device *dev); 

int (*resume) (struct device *dev); 


struct pm ext ops *pm; 


wW o T a O ae COE SD e 
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20 struct bus type private *p; 


2 

22 

23 struct device driver + 

24. const char *name; 

25 struct bus type *bus; 

26 

29 struct module *owner; 

28 const char *mod name; 

29 

30 int (*probe) (struct device *dev); 
31 int (*remove) (struct device *dev); 
32 void (*shutdown) (struct device *dev); 


33 int (*suspend) (struct device *dev, pm message t state); 
34 int (*resume) (struct device *dev); 
35 struct attribute group **groups; 














36 

ST SE UCE IOD SN DIU 

38 

39 struct driver private *p; 

40 Y; 

41 

42 struct device { 

AUS) ES truUc t KITSE klist children; 

44 struct klist node knode parent; 

45 struct klist node knode driver; 

46 struct klist node knode bus; 

47 struct device *parent; 

48 

49 struct kobject kobj; 

50  charbus id[BUS ID SIZE];  /* 在 父 总 线 中 的 位 置 */ 
51 const char *init name; /* 设备 的 初始 名 */ 
52 struct device type CYPE; 

53 unsigned uevent_suppress:1; 

54 

S9 struct semaphore sem; 

56 

57 struct bus type  *bus; /* 设备 所 在 的 总 线 类 型 */ 
58 struct device driver *driver; /* 设备 用 到 的 驱动 */ 
59 void "drpaver datis 

60 void *platform data; 

61 struct dev pm info power; 

62 

63 #ifdef CONFIG NUMA 

64 ipt numa_node; 

65 #endif 

66 u64 *dma mask; 

67 u64 coherent dma mask; 

68 

69 struct device dma parameters *dma parms; 

70 

FI Struct list head dma pools; 

72 

E Struct dma coherent mem *dma mem; 

74 
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15 
76 
77] 
78 
ji 
80 
81 
82 
83 
84 
85 
86 


SISTI 


Linux 文件 系统 


dev archdata archdata; 


Spinlock t devres lock; 


St 


struct 
SErUGE 
dev_t 

SEEVGG 


list_head devres_head; 


klist_node knode_class; 
class *class; 

devt; /* dev t, Os sysfs "dev" */ 
attribute group**groups; 





void (*release)(struct device *dev); 


; 


设备 文件 系统 


device driver 和 device 分 别 表 示 驱 动 和 设备 ， 而 这 两 者 都 必须 依附 于 一 种 总 线 ， 因 此 都 包含 


struct bus type 1 
















































































涌 向 内 核 ， 而 每 个 设备 和 驱动 涌 入 的 时 候 ， 都 会 去 寻找 自己 的 另 一 半 。 茫 茫 人 海 ， 
是 bus type 的 match0 成 员 函 数 将 两 者 捆绑 在 一 起 。 简 单 地 说 ， 设 备 和 驱动 就 是 红尘 中 漂浮 的 男女 ， 
j bus type 的 matchO 则 是 牵引 红线 的 月 老 ， 它 可 以 识别 什么 设备 与 什么 驱动 可 以 配对 。 

注意 ， 总 线 、 驱 动 和 设备 都 最 终 会 落实 为 sysfs 中 的 1 个 目录 ， 因 为 进一步 追踪 代码 会 发 现 ， 

















指针 。 在 Linux 内 核 中 ， 设 备 和 驱动 是 分 开 注 册 的， 注册 1 个 设备 的 时 候 ， 并 不 需 
要 驱动 已 经 存在 ， 而 1 个 驱动 被 注册 的 时 候 ， 也 不 需要 对 应 的 设备 已 经 被 注册 。 设 备 和 驱动 各 
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它们 实际 上 都 可 以 认为 是 kobject 的 派生 类 (device 结构 体 直接 包含 了 kobject kobj RA, M bus type 
和 device driver 则 透 过 bus type private. driver private 间接 包含 kobject)，kobject 可 看 作 所 有 总 
线 、 设 备 和 驱动 的 抽象 基 类 ，1 个 kobject 对 应 sysfs 中 的 1 个 目录 。 

总 线 、 设 备 和 驱动 中 的 各 个 attribute 则 直接 落实 为 sysfs 中 的 1 个 文件 ，attribute 会 伴随 着 show0 


和 store() 这 7 
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attribute. bus attribute, driver attribute 和 device attribute 这 几 个 结构 体 的 定义 。 








两 个 函数， 分别 用 于 读 和 写 该 attribute 对 应 的 sysfs 文件 结 点 ， 代 码 清单 5.7 给 出 了 





代码 清单 5.7 attribute, bus attribute, driver attribute 和 device attribute 结构 体 


struct. attribute 





20 
Zu 


const char *name; 
struct module *owner; 
mode t mode; 


un 


struct bus attribute 4i 


SEEGE 

ssize_t 

ssize_t 
}; 


attribute attr, 
(*show) (struct bus type *bus, char *buf); 


(*store) (struct bus type *bus, const char *buf, size t count); 


struct driver attribute { 


Sis Te Gs 
ssize t 
ssize t 


; 


attribute attr; 
Cenon (struct device driver "driver, Gien "buf): 
(*store) (struct device driver *driver, const char *buf, 
size t count); 


struct device attribute { 


(SUESCTKOHE 
ssize t 


atctribuLte rE en 
(*show) (strüct device le device attribute *attr, 
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24 peire t (*store)(istruct device *'dev, struct device attribute *artr, 
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SESE E, udev 规则 中 各 信息 的 来 源 实际 上 就 是 bus type. device driver. device 以 及 attribute 
等 所 对 应 sysfs 节点 。 


5.4.3 udev 的 组 成 


























udev 的 主页 位 于 : http://www.kernel.org/pub/linux/utils/kernel/hotplug/udev.html， 上 面包 含 了 
关于 udev 的 详细 介绍 ， 从 http://www.us.kernel.org/pub/linux/utils/kernel/hotplug/ 上 可 以 下 载 最 新 的 





udev 包 。udev 的 设计 目标 如 下 。 

e 在 用 户 空间 中 执行 。 

(1) 动态 建立 /删除 设备 文件 。 

(2) 允许 每 个 人 都 不 用 关心 主 /次 设备 号 。 

(3) 提供 LSB 标准 名 称 。 

(4) 如 果 需 要 ， 可 提供 固定 的 名 称 。 

为 了 提供 这 些 功 能 ，udev 以 3 个 分 割 的 子 计划 发 展 : namedev. libsysfs 和 udev。namedev 为 设 
备 命名 子 系统 ，libsysfs 提供 访问 sysfs 文件 系统 从 中 获取 信息 的 标准 接口 ，udev 提供 /dev 设备 节点 
文件 的 动态 创建 和 删除 策略 。udev 程序 背负 与 namedev 和 libsysfs 库 交 互 的 任务 ， 当 /sbin/hotplug 
程序 被 内 核 调用 时 ，udev 将 被 运行 。udev 的 工作 过 程 如 下 。 

(1) 当 内 核 检测 到 在 系统 中 出 现 了 新 设备 后 ,内 核 会 在 sysfs 文件 系统 中 为 该 新 设备 生成 新 的 
记录 并 导出 一 些 设 备 特定 的 信息 及 所 发 生 的 事件 。 

(2) udev 获取 内 核 导 出 的 信息 ， 它 调用 namedev 决定 应 该 给 该 设备 指定 的 名 称 ， 如 果 是 新 插 
入 设备 ，udev 将 调用 libsysfs 决定 应 该 为 该 设备 的 设备 文件 指定 的 主 /次 设备 号 ， 并 用 分 析 获 得 的 
设备 名 称 和 主 /次 设备 号 创建 /dev 中 的 设备 文件 ， 如 果 是 设备 移 除 ， 则 之 前 已 经 被 创建 的 /dev 文件 
将 被 删除 。 
在 namedev 中 使 用 5 步 序 列 来 决定 指定 设备 的 命名 。 

(1) 标签 (label) /序号 (serial): 这 一 步 检 查 设备 是 否 有 惟一 的 识别 记号 ， 例 如 USB 设备 有 
惟一 的 USB 序号 ，SCSI 有 惟一 的 UUID。 如 果 namedev 找到 与 这 种 1 号 相对 应 的 规则 ， 它 
将 使 用 该 规则 提供 的 名 称 。 

(2) 设备 总 线 号 : 这 一 步 会 检查 总 线 设 备 编号 ， 对 于 不 可 热 插 拔 的 环境 ， 这 一 步 足以 辨别 设 
备 。 例 如 ，PCI 总 线 编号 在 系统 的 使 用 期 间 内 很 少 变 更 。 如 果 namedev 找到 相对 应 的 规则 ， 规 则 
的 名 称 就 会 被 使 用 。 

(3) 总 线 上 的 拓扑 : 当 设 备 在 总 线 上 的 位 置 匹 配 用 户 指定 的 规则 时 ， 就 会 使 用 该 规则 指定 的 
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(4) BRAR: 当 内 核 提供 的 名 称 匹 配 指定 的 蔡 代 字符 串 时 ， 就 会 使 用 蔡 代 字符 串 指 定 的 名 称 。 

(5) 内 核 提 供 的 名 称 : 这 一 步 “ 包 罗 万 象 ” 如 果 以 前 的 几 个 步骤 都 没有 被 提供 ， 默 认 的 内 核 
将 被 指定 给 该 设备 。 

代码 清单 5.8 给 出 了 一 个 namedev 命名 规则 的 例子 ， 第 2、4 行 定 义 的 是 符合 第 1 步 的 规则 ， 
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000 





第 6. 8 行 定义 的 是 符合 第 2 步 的 规则 ,第 11、14 行 定 义 的 是 符合 第 3 步 的 规则 ， 第 16 行 定义 的 
是 符合 第 4 步 的 规则 。 














代码 清单 5.8 namedev 命名 规则 
USB Epson printer to be called lp epson 
LABEL, BUS-"usb", serial-"HXOLL0012202323480", NAME-"lp epson" 
USB HP printer to be called lp hp, 
LABEL, BUS-"usb", serial-"W09090207101241330", NAME-"lp hp" 
sound card with PCI bus 1d 00:05.0 to be the first sound card 
NUMBER, BUS-"pci", id-"00:0b.0", NAME-"dsp" 
sound card with PCI bus zd 00:07.1 to be the second sound card 
NUMBER, BUS-"pci", id-"00:07.1", NAME-"dspl" 
USB mouse plugged into the third port of the first hub to be 
called mouse0 
TOPOLOGY, BUS-"usb", place-"1.3", NAME-"mouse0" 
USB tablet plugged into the second port of the second hub to be 
called mousel 
TOPOLOGY, BUS-"usb", place-"2.2", NAME-"mousel" 
ttyUSB1 should always be called visor 
16 REPLACE, KERNEL-"ttyUSB1", NAME-"visor" 


5.4.4. udev 规则 文件 

udev 的 规则 文件 以 行为 单位 ， 以 “#” 开 头 的 行 代 表 注 释 行 。 其 余 的 每 一 行 代表 一 个 规则 。 
每 个 规则 分 成 一 个 或 多 个 匹配 和 赋值 部 分 。 匹 配 部 分 用 匹配 专用 的 关键 字 来 表示 ， 相 应 的 赋值 部 
分 用 赋值 专用 的 关键 字 来 表示 。 匹 配 关键 字 包 括 : ACTION (行为 )、KERNEL (匹配 内 核 设备 名 )、 
BUS 《匹配 总 线 类 型 )、SYSFS (匹配 从 sysfs 得 到 的 信息 ， 比 如 label. vendor. USB 序列 号 )、 
SUBSYSTEM 〈 匹 配子 系统 名 ) 等 ， 赋 值 关 键 字 包括 : NAME (创建 的 设备 文件 名 )、SYMLINK 
(符号 创建 链接 名 )、OWNER (设置 设备 的 所 有 者 )、GROUP (设置 设备 的 组 )、IMPORT〔 调 用 
外 部 程序 ) 等 。 
例如 ， 如 下 规则 : 


SUBSYSTEM--"net", ACTION--"add", SYSFS(address)--"00:0d:87:£6:59:£3", IMPORT-"/sbin/ 
rename netiface $k eth0" 


的 “匹配 ”部 分 有 3 项 ， 分 别 是 SUBSYSTEM, ACTION 和 SYSFS。 而 “赋值 ”部 分 有 
一 项 ， 是 IMPORT。 这 个 规则 的 意思 是 : 当 系 统 中 出 现 的 新 硬件 属于 net 子 系统 范畴 ， 系 统 对 该 
硬件 采取 的 动作 是 加 入 这 个 硬件 ， 且 这 个 硬件 在 sysfs 文件 系统 中 的 “address” 信 息 等 了 
“00:0d:87:f6:59: 人 ”时 ， 对 这 个 硬件 在 udev 层次 施行 的 动作 是 调用 外 部 程序 /sbin/rename_netiface， 
传递 给 该 程序 两 个 参数 ， 一 个 是 “%K” 代表 内 核对 该 新 设备 定义 的 名 称 ， 另 一 个 是 “eth0 ”。 
通过 一 个 简单 的 例子 可 以 看 出 udev 和 devfs 在 命名 方面 的 差异 。 如 果 系 统 中 有 两 个 USB H 
印 机 ， 一 个 可 能 被 称 为 /dev/usb/lp0， 男 外 一 个 便 是 /dev/usb/lpl1。 但 是 到 底 哪 个 文件 对 应 哪个 打印 
机 是 无 法 确定 的 ，lp0、lpl 和 实际 的 设备 没有 一 一 对 应 的 关系 ,映射 关系 会 因为 设备 发 现 的 顺序 ， 
打印 机 本 身 关 闭 等 原因 而 不 确定 。 因 此 ， 理 想 的 方式 是 两 个 打印 机 应 该 采用 基于 它们 的 序列 号 或 
者 其 他 标识 信息 的 办 法 来 进行 确定 的 映射 ，devfs 无 法 做 到 这 一 点 ，udev 却 可 以 做 到 。 使 用 如 下 
规则 : 


BUS-"usb", SYSFS(serial)-"HXOLL0012202323480", NAME="]p epson", SYMLINK="printers/ 
epson stylus" 


co -1001 4» € N HG 
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该 规则 中 的 匹配 项 目 有 BUS 和 SYSFS， 赋 值 项 目 为 NAME 和 SYMLINK， 它 意味 着 当 一 台 
USB 打印 机 的 序列 号 为 “HXOLL0012202323480” 时 ， 创 建 /dewlp_epson 文件 ， 并 同时 创建 一 个 
符号 链接 /dev/printers/epson_styles。 序 列 号 为 “HXOLL0012202323480” 的 USB 打印 机 不 管 何 时 
被 插入 ， 对 应 的 设备 名 都 是 /dewlp_epson， 而 devfs 显然 无 法 实现 设备 的 这 种 固定 命名 。 

udev 规则 的 写法 非常 灵活 ， 在 匹配 部 分 ， 可 以 通过 “*”“?3” [a—c]. [1779]55 shell 通配符 
来 灵活 匹配 多 个 项 目 。* 类 似 于 shell 中 的 * 通 配 符 ， 代替 任意 长 度 的 任意 字符 串 ,，? 代 蔡 一 个 字符 ， 
[x 一 y] 是 访问 定义 。 此 外 ，%k 就 是 KERNEL，%n 则 是 设备 的 KERNEL 序号 (如 存储 设备 的 分 
区 号 )。 

可 以 借助 udev 中 的 udevinfo 工具 查找 规则 文件 可 以 利用 的 信息 ， 如 运行 “udevinfo -a -p/ 
sys/block/sda” 命 令 将 得 到 : 


Udevinfo starts with the device specified by the devpath and then 
walks up the chain of parent devices. It prints for every device 































































































































































































found, all possible attributes in the udev rules key format. 
A rule to match, can be composed by the attributes of the device 
and the attributes from one single parent device. 


looking at device '/block/sda': 
KERNEL--2"sda" 
SUBSYSTEM--"block" 


DRIVER=="" 

PUEERES Ea 1 689 S69 85 746 24 000 2 (91:7 DEEDIOE S2396 
47 292 0 AS SS UI 29m" 

ATTR{size}=="6 291 456" 


ATTR{removable}=="0" 
ATTR{range}=="16" 
ATTR{dev}=="8:0" 


looking at parent device '/devices/platform/host0/target0:0:0/0:0:0:0': 
KERNELS--2"0:0:0:0" 
SUBSYSTEMS--"scsi" 
DRIVERS--2"sd" 
TRS(ioerr cnt)]--"0x5" 
'TRS(iodone cntj--"0xe86" 
TRS(iorequest cnt]--"0xe86" 
TRS[iocounterbits]--"32" 
T'TRS {timeout }=="30" 
TRS {state}=="running" 
U'TRS(rev)--"1.0 " 
'TRS(modelj--"VMware Virtual S" 
TRS {vendor }=="VMware, " 
TRS(scsi levelj--"3" 
UITRS(type)--"0" 
TRS(queue typej]--2"none" 
'TRS(queue depthj--"3" 
'TRS(device blocked)--"0" 





POE M E M E ETE TM ED 





looking at parent device '/devices/platform/host0/target0:0:0': 
KERNELS--"target0:0:0" 
SUBSYSTEMS--"" 
DRIVERS--2"" 
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looking at parent device '/devices/platform/hostO0': 
KERNELS--"hostO0" 
SUBSYSTEMS--"" 
DRIVERS--2"" 


looking at parent device '/devices/platform': 
KERNELS--"platform" 
SUBSYSTEMS--"" 
DRIVERS--"" 


5.4.5 创建 和 配置 mdev 
在 蔡 入 式 系统 中 ， 通 常 可 以 用 udev 的 轻 量 级 版 本 mdev, mdev 集成 于 busybox HEME 





VirtualBox i10. l/home/lihacker/develop/svn/1dd6410-read-only/utils/busybox-1.15.1 目录 ) 中 。 在 
目录 运行 make menuconfig， 进 入 “Linux System Utilities” 子 选项 ， 选 中 mdev 


busybox 的 源 代码 
































相关 项 目 ， 如 图 5-4 所 示 。 





Ele Edit view Terminal Tabs Help 


Linux System Utilities 


Arrow keys navigate the menu. «Enter» selects submenus --->. Highlighted letters are 


hotkeys. 


Pressing «Y» includes, «N» excludes, «M» modularizes features. Press 


«Esc»«Esc» to exit, «?» for Help, </> for Search. Legend: [*] built-in [ ] excluded 


«M» module 


p—^(-) 
[] osetup 
[i mm 
[  upport /etc/mdev.conf 
 upport subdirs/symlinks 
 upport regular expressions substitutions when renaming device 








« » module capable 


 upport command execution at device addition/removal 
 upport loading of firmwares 
m swap 
m re 
‘se termios to manipulate the screen 
xt filesystem 
eiser filesystem 
at filesystem 
h s filesystem 


« Exit » « Help » 


5.4 busybox 中 的 mdev 选项 














LDD6410 根 文 件 系统 中 /etc/init.d/reS 包含 的 如 下 内 容 即 是 为 了 使 用 mdev 的 功能 : 
/bin/mount -t sysfs sysfs /sys 

/bin/mount -t tmpfs mdev /dev 

echo /bin/mdev » /proc/sys/kernel/hotplug 


mdev -s 
































其 中 “mdev -s” 的 含义 是 扫描 /sys 中 所 有 的 类 设备 目录 ， 如 果 在 目录 中 含有 名 为 “dev” 


















































的 文件 ， 且 文件 中 包含 的 是 设备 号 ， 则 mdev 就 利用 这 些 信息 为 该 设备 在 /dev 下 创建 设备 节点 








X 牛 。 


“ echo /sbin/mdev > /proc/sys/kernelhotplug” 的 含义 是 当 有 热 插 拔 事件 产生 时 ， 内 核 就 会 调用 
位 于 /sbin 目录 的 mdev。 这 时 mdev 通过 环境 变量 中 的 ACTION 和 DEVPATH， 来 确定 此 次 热 
拔 事件 的 动作 以 及 影响 了 /sys 中 的 那个 目录 。 接 着 会 看 看 这 个 目录 中 是 否 有 “dev” 的 属性 文件 ， 
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如 果 有 就 利用 这 些 信息 
若 要 修改 mdev 的 规则 ， 可 通 





为 这 个 设备 在 /dev 下 创建 设备 





























节点 文件 。 


过 修改 /etc/mdev.conf 文件 实现 。 


LDD6410 的 SD 和 NAND 文件 系统 

















的 第 
| 作 方 法 如 下 。 








LDD6410 的 SD 卡 分 为 两 个 区 ， 其 ! 
数据 (5.2.1 节 给 出 的 各 个 目录 )， 其 
(1) 在 安装 了 Linux 的 PC 机 上 i 














— 
zd 


















































Command (m for help): p 





Disk /dev/sdb: 1 030 MB, 
42 mecla, G2 sectorsPhrack, 
cylinders of 1984 * 512 - 
0x6£20736b 


1 014 cylinders 
Units - TOUIS S08 


Disk identifier: 


Device Boot Start 
/dev/sdbl  * 1 
/ dev/sdb2 21 


注意 第 1 个 分 区 制作 的 命令 为 : 


Command (m for help): n 


1$ 











Command action 





e extended 

p primary partition (1-9) 
p 

Partition number (1-4): 1 
(di Q4. 


Using default value 1 


First cylinder default 1): 


Last cylinder, -*cylinders or *size(K,M,G) 
A [x 步 
第 2 个 分 区 制作 的 命令 是 : 


Command 











(n for help): n 
Command action 

e extended 

p primary partition (1-4) 
p 
Partition number (1-4): 2 
(NIST ORA 
Using default value 21 


First cylinder default 21): 


Last cylinder, -*cylinders or -*size(K,M,G) 
Using default value 1 014 


Command 
我 们 还 要 


Command 


(n for help): 
命令 标记 第 1 个 分 


(n for help): a 
Qm 


» 





D 











通过 “a 








Partition number 


€ w” 











过 fdisk 给 一 张 空 
已 经 包含 ， 请 通过 fdisk 的 “d” 命 令 全 部 删除 )， 得 到 如 下 的 分 区 


Blocks 


98 6048 


ii bab. 


(2-1 4, 





2 个 分 区 为 ext3 文件 系统 ， 存 放 LDD6410 的 





PE 


文件 




















4T 


分 为 
区 表 : 


2 个 区 








(如 果 SD 


7i 


的 SD 





AL OSO 225 S20 OYE 


bytes 


Id System 
83 Linux 
B 


809 


Linux 


20M 


default 1 014): 


default 1 014): 











命令 把 建 好 的 分 区 表 写 入 SD 1 








最 后 要 通过 


7i 
o 





AH 
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(2) 格式 化 SD 卡 的 分 区 1 和 分 区 2: 
mkfs.vfat /dev/sdbl 
mkfs.ext3 /dev/sdb2 
fsck.ext3 /dev/sdb2 


(3) 如 图 5-5 所 示 ， 通 过 moviNAND Fusing TooLexe 烧 写 SD F U-BOOT 和 zImage. 























Si moviNAND Fusing Tool for Samsung Linux 














SRAMSize |8KB Image file |c: lu-boot-movi,bin 
EFuseSize |1KB The image file will be fused from |2011598 | to 


Kernel 


Bootloader Image file 
256 

The image file will be fused from 
Kernel 

Rootfs 


Image file 


The image file will be fused from 


Image File | C: Image-fix 


5.5 FE LDD6410 ff SD + U - BOOT 5l ziImage 























更 新 SD 卡 根 文件 系统 的 方法 很 简单 ， 在 PC 机 上 mount/dev/sdb2 后 ， 直 接 通过 


ga "fg evour-rocot£s* «sdo2-mount-poinut- 

即 可 替换 根 文 件 系统 了 。<your-rootfs> 是 根 文件 系统 的 目录 ，<sdb2- mount- point»7é/dev/sdb2 
挂 载 的 目录 。 

特别 要 注意 的 是 ，SD 的 设备 节点 不 一 定 是 /devsdb， 应 该 视 用 户 电脑 的 硬盘 情况 而 言 ， 可 能 
是 /dev/sdc、/dewsdd 等 。 

LDD6410 的 NAND 分 为 3 个 区 ， 分 别 存放 U-BOOT, zImage 和 文件 系统 。 该 分 区 表 定 义 在 
LDD6410 的 BSP ! 












































SEXE me oa enor el 
{ 
.name = "Bootloader", 
.offset = 0, 
.size = (52sm Im. 
), 
{ 
. name = "Kernel", 
.offset = (2Sa 1*5. 
.size = (AS d) = (B12999 in). 
), 
{ 
. name = "File System", 
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Offset = MIDPART OFS APPEND, 
.Size — MTDPART SIZ FULL, 
J 











更 新 NAND 中 U-BOOT 的 方法 如 下 : 

(1) 通过 tftp 或 nfs 等 方式 获取 新 的 U-BOOT， 如 : 
leu oe oo oie pim uw ee eee ls lal 

(2) 运行 : 

flashcp u-boot-movi.bin /dev/mtdO 


























更 新 NAND 中 zImage 的 方法 如 下 : 
CI) 通过 tftp 或 nfs 等 方式 获取 新 的 zImage, ZU: 
Bo re I te be a 
(2) 运行 : 
flashcp zImage-fix /dev/mtdl 
更 新 NAND 中 文件 系统 的 方法 如 下 : 
在 PC 上 将 做 好 的 新 的 根 文件 系统 拷贝 至 
指 代 该 目录 。 

以 SD 卡 或 NFS 为 根 文件 系统 启动 系统 ， 运 行 如 下 命令 擦 除 /dev/mtd2 分 
flash eraseall /dev/mtd2 
然后 将 NAND 的 该 分 区 mount 到 /mnt: 
mount /dev/mtdblock2 -t yaffs2 /mnt/ 
将 新 的 文件 系统 拷贝 到 /mnt; 
cp -fa «new rootfs dir» /mnt 


若 上 述 命令 运行 过 程 中 设备 结 点 不 存在 ， 可 先 执行 : 




































































REK NFS 的 某 目 录 ,， 下 面 我 们 以 <new_rootfs_dir> 








Z 
z 
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mdev -s 

局 动 到 LDD6410， 在 根 目录 下 运行 ls， 会 发 现 LDD6410 根 文 件 系 统 包 含 如 下 子 目 录 : 
1s 

android INERTO sbin 

bin HUS sqlite stmt journals 

cache linuxrc Sys 

data lost+found system 

demo mnt tmp 

dev opt usr 

etc proc var 

init. goldfish. rc qtopia 

















其 中 的 /data /cache /system /sqlite_stmt journals 为 Android 所 需要 的 目录 ，/opt 下 存放 
Qt/Embedded 的 可 执行 文件 。 运 行 “/android& ”可 启动 Android， 运 行 “/qtopia 多” 可 启动 
Qt/Embedded. 

/demo 目录 下 存放 在 一 些 用 于 demo 的 图 片 、MP3 等 ， 如 运行 如 下 命令 可 显示 jpeg 图 片 1.jpg、 


2.jpg、3.jpg 和 4.jpg。 
# cd /demo/ 
* jpegview 1.jpg 2.jpg 3.jpg 4.jpg 
280821722 74/8(085:4272:8 0082172 15628008450 002172 
framebase = 0x4016c000 err=0 
ImageWidth-362 ImageHeight-272 
read 1.jpg OK 
ImageWidth-362 ImageHeight-272 
























































read 2.jpg OK 
ImageWidth-362 ImageHeight-272 
read 3.jpg OK 
ImageWidth-362 ImageHeight-272 
read 4.jpg OK 


5.0 EL 





























Linux 文件 系统 与 设备 文件 系统 
































Linux 用 户 空间 的 文件 编程 有 两 种 方法 ， 即 通过 Linux API 和 通过 C 库 函 数 访问 文件 。 用 户 














空间 看 不 到 设备 驱动 ， 能 看 到 的 只 有 设备 对 应 的 文件 ， 因 此 文件 编程 即 是 用 户 空间 的 设备 编程 。 



















































































Linux 按照 功能 对 文件 系统 的 目录 结构 进行 了 良好 的 规划 。/dev 是 设备 文件 的 存放 目录 ，devfs 
和 udev 分 别 是 Linux 2.4 和 Linux 2.6 生成 设备 文件 节点 的 方法 ， 前 者 运行 于 内 核 空 间 ， 后 者 运行 

















j 户 空间 。 






























































Linux 2.6 通过 一 系列 数据 结构 定义 了 设备 模型 ， 设 备 模型 与 sysf 文件 系统 中 的 目录 和 文件 



































存在 一 种 对 应 关系 ，udev 可 以 利用 sysfs ! 
设备 文件 节点 。 


























记录 的 信息 定义 规则 并 提取 主 次 设备 号 动态 创建 /dev 
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本 章 导读 


在 整个 Linux 设备 
解 Linux 字符 设备 邓 
6. 节 讲 解 了 Linux 字符 设备 驱动 的 关键 数 
operations 结构 体 的 操作 方法 ， 
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ji 
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ni 























区 动 程序 的 结构 ， 并 解释 其 主要 组 











出 了 简单 的 设计 模板 。 





6.2 节 描 述 了 本 章 及 后 续 各 章 





的 讲解 。 


6.3 节 依 据 6.1 节 的 知识 i 
写 函 数 、seek0) 函 数 和 IO 控制 函数 等 进行 了 上 
globalmem 的 引 











区 动 程序 以 利 
6.4 节 给 出 了 6.3 节 的 globalmem 设备 驱动 在 用 























Paii 











分 析 了 Linux 



































区 动 的 学 习 中 ， 字 符 设 备 驱动 较为 基础 。 本 草 将 讲 
gp 





成 部 分 的 














I IY 
































解 globalmem 设备 的 马 








私有 数据 。 














VETE. 











E cdev 及 fie 





CR 








GERAN, 





节 所 基于 的 globalmem 虚拟 字符 设备 ， 
第 6 一 9 章 都 将 基于 该 虚拟 设备 实例 进行 字符 设备 驱动 及 并 发 控制 等 知识 



































8 动 编写 方法 ， 对 读 
E 点 分 析 。 该 节 的 最 后 改造 














户 空间 的 验证 。 


Linux 字符 设备 驱动 结 


6.1.1 cdev 结构 体 















































代码 清单 6.1 cdev 结构 体 
JL TREE E GO d 
2 struct kobject kobj; /* ARIJ kobject 对 象 */ 
3 struct module *owner; /* 所 属 模块 */ 
4 struct file operations *ops; /* 文 件 操作 结构 体 */ 
5 Struct Tirst head Tist; 
6 dev t dev; [FR I 
T unsigned int count; 


px 


字符 设备 驱动 























在 Linux 2.6 内 核 中 ， 使 用 cdev 结构 体 描述 一 个 字符 设备 ，cdev 结构 体 的 定义 如 代码 清单 6.1。 











cdev 结构 体 的 dev_t 成 员 定义 了 设备 号 ,为 32 位 ， 其 中 12 位 主 设备 号 ，20 位 次 设备 号 。 使 








用 下 列 宏 可 以 从 devt 获 得 主 设备 号 和 次 设备 号 : 
MAJOR(dev t dev) 
MINOR(dev t dev) 
而 使 用 下 列 宏 则 可 以 通过 主 设备 号 和 次 设备 号 生成 dev. t: 


MKDEV (int major, int minor) 






























































cdev 结构 体 的 另 一 个 重要 成 员 file operations 定义 了 字符 设备 驱动 提供 给 虚拟 文件 系统 的 接 











口 函数 。 
Linux 2.6 内 核 提 供 了 一 组 函数 用 于 操作 cdev 结构 体 : 


void cdev init(struct cdev *, struct file operations *); 

















struct cdev *cdev alloc(void); 
void cdev put(struct cdev *p); 
int cdev add(struct cdev *, dev t, unsigned); 
«void edev del(struct cdev. *); 
































cdev_initO 函 数 用 于 初始 化 cdev 的 成 员 ， 并 建立 cdev 和 file operations 之 间 的 连接 ， 其 源 代 


| 














码 如 代码 清单 6.2 所 示 。 





P2 








代码 清单 6.2 cdev init() ER 2t 
1 void cdev init(struct cdev *cdev, struct file operations *fops) 
PEE 
3 memsetí(cdev, 0, sizeof *cdev); 
4 INIT LIST HEAD(&cdev-»list); 
$5) kobject init(&cdev-»5kobj, &ktype cdev default); 
6 cdev-»ops = fops; /* 将 传 入 的 文件 操作 结构 体 指针 赋值 给 cdev 的 ops*/ 
yi 





| 























cdev_allocO 函 数 用 于 动态 申请 一 个 cdev 内 存 ， 其 源 代 码 如 代码 清单 63 所 示 。 








代码 清单 6.3 cdev alloc()E 2 


1 struct cdev *cdev alloc (void) 
2 A 
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E struct cdev *p - kzalloc(sizeof(struct cdev), GFP KERNEL); 
4 AE que) d 

5 INIT LIST HEAD(&p-»list); 

6 kobject init(&p-»kobj, &ktype cdev dynamic); 

y } 

8 return p; 

$9 











cdev_add0 函 数 和 cdev_del0) 函 数 分 别 向 系统 添加 和 删除 一 个 cdev， 完 成 字符 设备 的 注册 和 注 
销 。 对 cdev_add0 的 调用 通常 发 生 在 字符 设备 驱动 模块 加 载 函数 中 ， 而 对 cdev_del0 函 数 的 调用 则 
通常 发 生 在 字符 设备 驱动 模块 卸载 函数 中 。 
6.1.2 分配 和 释放 设备 号 
在 调用 cdev_add0) 函 数 向 系统 注册 字符 设备 之 前 ， 应 首先 调用 register_chrdev_region() 或 
alloc_chrdev_region0 函 数 向 系统 申请 设备 号 ， 这 两 个 函数 的 原型 为 


int register chrdev region(dev t from, unsigned count, const char *name); 

















































































































int alloc chrdev region(dev t *dev, unsigned baseminor, unsigned count, 
const char *name); 


register chrdev region() KAH F C ATE t e HS] e 5 HT US. 而 alloc chrdev region H F 
设备 号 未 知 ， 向 系统 动态 申请 未 被 占用 的 设备 号 的 情况 ， 函 数 调用 成 功 之 后 ， 会 把 得 到 的 设备 号 
放 入 第 一 个 参数 dev 中 。alloc_chrdev_region() 与 register_chrdev_region0 对 比 的 优点 在 于 它 会 自动 
避 开 设备 号 重复 的 冲突 。 

相反 地 ， 在 调用 cdev_del0 函 数 从 系统 注销 字符 设备 之 后 ，unregister_chrdev_region() 应 该 被 调 
用 以 释放 原先 申请 的 设备 号 ， 这 个 函数 的 原型 为 : 


void unregister chrdev region(dev t from, unsigned count); 
6.1.3 file operations 结构 体 

file operations 结构 体 中 的 成 员 函 数 是 字符 设备 驱动 程序 设计 的 主体 内 容 , 这 些 函 数 实际 会 在 
应 用 程序 进行 Linux 的 open()、write()、read()、close0O) 等 系统 调用 时 最 终 被 调用 。file_operations 
结构 体 目前 已 经 比较 庞大 ， 它 的 定义 如 代码 清单 6.4 所 示 。 














































































































































































































代码 清单 6.4 file operations 结构 体 


1 struct file operations ( 

2 struct module *owner; 

3 /* 拥有 该 结构 的 模块 的 指针 ， 一 般 为 THIS_MODULES */ 
4 loff LOCLDSEBk)Usbruct file" Tert t. 18b 
5 /* 用 来 修改 文件 当前 的 读 写 位 置 */ 
6 

T 

8 




















esrza titread)(obrursboraie t) char — user we olre t loni teis 
/* 从 设备 中 同步 读 取 数 据 */ 

SS DE Lp('write) (struct file *, rtonst Ghar  uwSer *. sSisp L, lori tsje 
9 /* 向 设备 发 送 数据 */ 
O ssrace pI*alo read)(struct kaioeb nee weer a size t, one t). 
iti /* 初始 化 一 个 异步 的 读 取 操 作 */ 
qe STZ UME Ve) (Ee eee v Cnst char — user *, Sloe b, lori thè 
13 /* 初始 化 一 个 异步 的 写 入 操作 */ 
14 (le (Sn ee 
IIb /* 仅 用 于 读 取 目 录 ， 对 于 设备 文件 ， 该 字段 为 NULL */ 
Ie misicne Taco (errue etila eu CIENTO OPI TC ES ee e 
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000 














































































































iy) /* 轮 询 函 数 ， 判 断 目 前 是 否 可 以 进行 非 阻 塞 的 读 取 或 写 入 */ 

18  int(*ioctl) (struct inode *, struct file *, unsigned int, unsigned long); 
19 /* 执行 设备 1/0 控制 命令 */ 

20  long(*unlocked ioctl) (struct file *, unsigned int, unsigned long); 
21 /* 不 使 用 BLK 的 文件 系统 ， 将 使 用 此 种 函数 指针 代替 ioctl */ 

22  Llong(*compat ioctl) (struct file *, unsigned int, unsigned long); 
23 /* 在 64 位 系统 上 ，32 位 的 ioctl 调用 ， 将 使 用 此 函数 指针 代替 */ 

parte mma sene NE NS ES UT S EMIT area SEIS E DN 

25 /* 用 于 请 求 将 设备 内 存 映射 到 进程 地 址 空间 */ 

2G. Tn ne ne ren 

27 A Sapoar 5 

29 ame (Cose Tos 80). (Uisseseniene. seat lor) p 

29  int(*release) (struct inode *, struct file*); 

30 /* RAE 

3i Mar WA (Oem one cuba v» emeret Mole ere UL iit Teleueceieiyam e) p 

32 /* 刷新 待 处 理 的 数据 */ 

oom trao ceva) ue ole MEI E el Sle 

34 /* WP £sync */ 

35 aee) (agmen et s oues) e 

36 /* 通知 设备 FASYNC 标志 发 生变 化 */ 

a me Ne) Mr ee fils f. Nb. wtruct fale locii 





Ssutzes Gsendpage) (Struct Isi CN SC page MEETS Sn oe tt 
/* 通常 为 NULL */ 
unsigned long(*get unmapped area) (struct file *,unsigned long, unsigned long, 














unsigned long, unsigned long); 
/* 在 当前 进程 地 址 空间 找到 一 个 未 映射 的 内 存 段 */ 
int (*check flags) (int); 
/* 允许 模块 检查 传递 给 fcntl(F SETEL...) 调用 的 标志 */ 
int(*dir notify) (struct file *filp, unsigned long arg); 
/* 对 文件 系统 有 效 ， 驱 动 程序 不 必 实 现 */ 
Ee eee) eruet Ee le Servet ed Le lee) 
ssize t (*splice write) (struct pipe inode info *, struct file *, loff t *, size t, 
unsigned int); /* 由 YVES 调用 ， 将 管道 数据 粘 接 到 文件 */ 
SS emu Spikceebead)stauct diee efit ot emmodemsbim tom Sizes 
unsigned int); /* 由 VES 调用 ， 将 文件 数据 粘 接 到 管道 */ 
nmm (eee eee oe S NE on qt CM oc SN. 







































































HUN ODE a be aae ts HM OO NEGO, 
EO S N T COO: A EEC ER 
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C N 

















下 面 我 们 对 file operations 结构 体 中 的 主要 成 员 进行 分 析 。 
llseekO 函 数 用 来 修改 一 个 文件 的 当前 读 写 位 置 ， 并 将 新 位 置 返回 ， 在 出 错时 ， 这 个 函数 返回 
个 负 值 。 
read0 函 数 用 来 从 设备 中 读 取 数据 ， 成 功 时 函数 返回 读 取 的 字 节 数 ， 出 错时 返回 一 个 负 值 。 
write() 函 数 向 设备 发 送 数 据 ， 成 功 时 该 函数 返回 写 入 的 字 节 数 。 如 果 此 函数 未 被 实现 ， 当 用 
户 进行 write0 系 统 调用 时 ， 将 得 到 -EINVAL 返回 1 
readdirO 函 数 仅 用 于 目录 ， 设 备 节点 不 需要 实现 它 。 
ioctlO 提 供 设备 相关 控制 命令 的 实现 〈 既 不 是 读 操作 也 不 是 写 操作 )， 当 调用 成 功 时 ， 返 回 给 
调用 程序 一 个 非 负 值 。 
mmap(O 函 数 将 设备 内 存 映射 到 进程 内 存 中 ， 如 果 设 备 驱动 未 实现 此 函数 ， 用 户 进行 mmap() 
系统 调用 时 将 获得 -ENODEYV 返回 值 。 这 个 函数 对 于 帧 缓冲 等 设备 特别 有 意义 。 
当 用 户 空间 调用 Linux API 函数 open() 打 开设 备 文件 时 ， 设 备 驱 动 的 open( 〇 函数 最 终 被 调 
驱动 程序 可 以 不 实现 这 个 函数 ， 在 这 种 情况 下 ， 设 备 的 打开 操作 永远 成 功 。 与 open0 函 数 对 应 的 
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是 release) K X. 


poll0 函 数 一 般 用 于 询问 设备 是 否 可 被 非 阻塞 地 立即 读 写 。 当 询问 的 条 件 未 触发 时 ， 用 户 空间 
进行 select() 和 poll0 系 统 调用 将 引起 进程 的 阻塞 。 
aio_read() 和 aio write() RK Z4 2] Xl] Ej SC TRDAS ROSE INE] e XETT RIPE. RUE. Wrfe3kI 


































































































这 两 个 函数 后 ， 用 户 空 间 可 以 对 该 设备 文件 描述 符 调用 aio_read()、aio_write0 等 系统 调用 进行 读 写 。 


6.1.4 Linux 字符 设备 驱动 的 组 成 
在 Linux 中 ， 字 符 设 备 驱 动 由 如 下 几 个 部 分 组 成 。 
1. 字符 设备 驱动 模块 加 载 与 卸载 函数 
字符 设备 驱动 模块 加 载 函数 中 应 该 实现 设备 号 的 申请 和 cdev 的 注册 ， 而 在 卸载 函数 中 应 实 


在 





现 设 备 号 的 释放 和 cdev 的 注销 。 
工程 师 通常 习惯 为 设备 定义 一 个 设备 相关 的 结构 体 ， 其 包含 该 设备 所 涉及 的 cdev、 私 有 数据 



































































































































及 信和 号 量 等 信息 。 常 见 的 设备 结构 体 、 模 块 加 载 和 卸载 函数 形式 如 代码 清单 6.5 所 示 。 
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代码 清单 6.5 ”字符 设备 驱动 模块 加 载 与 卸载 函数 模板 


/* 设备 结构 体 


SEruUCE XXX dey f 


} 


struct cdev cdev; 


XXX dev; 


/* 设备 驱动 模块 加 载 函 数 


GheWEOAe abe a0 ERR ansa (SUO) 
{ 
cdev init(&xxx dev.cdev, &xxx fops); /* 初始 化 cdev */ 
XXX dev.cdev.owner - THIS MODULE; 
/* 获取 字符 设备 号 */ 
agr Moo em ona) A 
register chrdev region(xxx dev no, 1, DEV NAME); 
] else { 
alloc chrdev region(&xxx dev no, 0, 1, DEV NAME); 
} 


ret = cdev add(&xxx dev.cdev, xxx dev no, 1); /* 注册 设备 */ 





} 
/*# 设 备 驱动 模块 印 载 函 数 */ 


static void . exit xxx exit(void) 

















unregister chrdev region (xxx dev no, 1); /* 释放 占用 的 设备 号 */ 
cdev del(&xxx dev.cdev); /* 注销 设备 */ 





} 
2. 字符 设备 驱动 的 file_operations 结构 体 中 成 员 函 数 
file operations 结构 体 中 成 员 函 数 是 字符 设备 驱动 与 内 核 的 接口 ， 是 用 户 空间 对 Linux 进行 系 



























































统 调 ) 


] 最 终 的 落实 者 。 大 多 数字 符 设备 驱动 会 实现 read0、write0 和 ioctl0 函 数 ， 常 见 的 字符 设备 



































驱动 的 这 3 个 函数 的 形式 如 代码 清单 6.6 所 示 。 
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代码 清单 6.6 ”字符 设备 驱动 读 、 写 、1/O 控制 函数 模板 





1 /* 读 设备 */ 
2 Ssize t xxx read(struct file *filp, char user *buf, size t count, 
3 ES 
4 ( 
5) 
6 COPY COSE do bn ems. meo) 
H 
8 } 
9 * Bhe 
0) Gerze te Swe Ect xcablle en Senee Goera wees ou subs: t. CON 
1 Jiguesg ie, "exe. OS) 
2o 
3 
4 COPY TEON eene (ee or. DUL sco) 
5 
G E 
7  /* ioctl HJ */ 
8 int xxx ioctl(struct inode *inode, struct file *filp, unsigned int cmd, 
5 unsigned long arg) 
ZONE 
21 CC 
22 switch (cmd) ( 
23) case XXX CMD1: 
24 A 
25 break; 
26 case XXX_CMD2: 
27 
28 break; 
2S default: 
30 /* 不 能 支持 的 命令 */ 
Sb return - ENOTTY; 
$2) } 
33 return 0; 
34 y 


设备 驱动 的 读 函 数 中 ，filp 是 文件 结构 体 指针 ，buf 是 用 户 空间 内 存 的 地 址 ， 该 地 址 在 内 核 空 
间 不 能 直接 读 写 ，count 是 要 读 的 字 节 数 ，f_pos 是 读 的 位 置 相 对 于 文件 开头 的 偏 移 。 
设备 驱动 的 写 函 数 中 ，filp 是 文件 结构 体 指针 ，buf 是 用 户 空间 内 存 的 地 址 ， 该 地 址 在 内 核 空 
间 不 能 直接 读 写 ，count 是 要 写 的 字 节 数 ，f_ pos 是 写 的 位 置 相对 于 文件 开头 的 偏 移 。 
由 于 内 核 空 间 与 用 户 空 间 的 内 存 不 能 直接 互 访 ， 因 此 借助 了 函数 copy_from_user0 完 成 用 户 空间 
到 内 核 空 间 的 拷贝 ， 以 及 copy_to_user0 完 成 内 核 空间 到 用 户 空间 的 拷贝 ， 见 代码 第 6 行 和 第 14 行 。 
完成 内 核 空间 和 用 户 空 间 内 存 找 贝 的 copy. from. user() fll copy_to_user() 的 原型 分 别 为 : 


unsigned long copy from user(void *to, const void | user *from, unsigned long count); 
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unsigned long copy to user(void . user *to, const void *from, unsigned long count); 
上 述 函 数 均 返 回 不 能 被 复制 的 字 节 数 ， 因 此 ， 如 果 完 全 复制 成 功 ， 返 回 值 为 0。 
如 果 要 复制 的 内 存 是 简单 类 型 ， 如 char. int. long 等 ， 则 可 以 使 用 简单 的 put_user0 和 get 
user(), Jl: 
int val; /* 内 核 空 间 整 型 变量 







































































































































































get user(val, (int *) arg); /* 用 户 一 内 核 ，arg 是 用 户 空 间 的 地 址 





INUX 123 





Linux 设备 驱动 开发 详解 (第 2 版 ) 





124 





























put user(val, (int *) arg); /* 内 核 一 用 户 ，azg 是 用 户 空 间 的 地 址 
读 和 写 函 数 中 的 __user 是 一 个 宏 ， 表 明 其 后 的 指针 指向 用 户 空间 ， 这 个 宏 定义 为 : 
#ifdef __CHECKER__ 


























# define __user . attribute  ((noderef, address space(1))) 
#else 

# define __user 

#endif 





LO 控制 函数 的 cmd 参数 为 事先 定义 的 VO 控制 命令 ， 而 arg 为 对 应 于 该 命令 的 参数 。 例 
如 对 于 串 行 设备 ， 如 果 SET BAUDRATE 是 一 道 设置 波 特 率 的 命令 ， 那 后 面 的 arg 就 应 该 是 
波 特 率 值 。 

在 字符 设备 驱动 中 ， 需 要 定义 一 个 file operations 的 实例 ， 并 将 具体 设备 驱动 的 函数 赋值 给 
file_operations 的 成 员 ， 如 代码 清单 6.7 所 示 。 


代码 清单 6.7 字符 设备 驱动 文件 操作 结构 体 模板 




















































































































struct file operations xxx fops = { 
.owner = THIS MODULE, 
.read - xxx read, 


i 

2 

3 

4 .write = xxx write, 
5 caexeuEdl -— 5119 TOOL L 
6 

y 


}; 
上 述 xxx_fops 在 代码 清单 6.5 第 10 行 的 cdev_init(&xxx_dev.cdev, &xxx_fops) 的 语句 中 被 建立 
与 cdev 的 连接 。 
图 6.1 所 示 为 字符 设备 驱动 的 结构 、 字 符 设备 驱动 与 字符 设备 以 及 字符 设备 驱动 与 用 户 空 间 
访问 该 设备 的 程序 之 间 的 关系 。 
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6.1. 字符 设备 驱动 的 结构 


6.2 globalmem 虚拟 设备 实例 描述 


从 本 章 开始 ， 后 续 的 数 章 都 将 基于 虚拟 的 globalmem 设备 进行 字符 设备 驱动 的 讲解 。 globalmem 





















































INUX 








意味 着 “全 局 内 存 ”， 妊 
的 内 存 空间 ， 并 在 3 














过 Linux 系统 调 











访问 这 片 内 存 。 





实际 上 ， 这 个 虚拟 的 globalmem 设备 几乎 没有 任何 实用 价 但 
便 而 凭空 制造 的 设备 。 当 然 ， 它 
时 访问 ， 其 中 的 全 局 内 存 可 作为 用 
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动 中 提供 针对 该 片 内 存 的 读 写 、 控 和 

















判 和 定位 函数 ， 以 供用 


字符 设备 驱动 


E globalmem 字符 设备 驱动 中 会 分 配 一 片 大 小 为 GLOBALMEM SIZE (4KB) 























户 空间 的 进程 能 通 
























































bb 并 非 百 无 一 用 ， 


















































于 globalmem 可 














， 仅 仅 是 一 种 为 了 



























































6.3 globalmem 设备 驱动 


6.3.1 


在 globalmem 


相关 宏 。 


(or 
Q 
KDE DE DvD E CD E CD NS CD) 








Q 0 -]1 oO U 50 M^c| 
| 
3 
Q 





-uae 





QOO: P OC OUT wes US NO ptc 





c AE Y 





头 文件 、 安 及 设备 结构 体 














代码 清单 6.8 globalmem 设备 结构 体 和 宏 


linux/module. 
linux/types.h 
linux/fs.h» 
linux/errno.h 
linux/mm.h» 
linux/sched.h 


x 
< 
« 
& 
< 
« 
Eelinux/initohx 
« 





DU oD cdenv n> 
<asm/io.h> 


define GLOBALMEM SIZE 0x1000 
define MEM CLEAR 0x1 
#define GLOBALMEM MAJOR 250 








h» 
2 


2 


2e 


include «asm/system.h» 
include «asm/uaccess.h» 











/* 清 零 全 局 内 存 */ 


static int globalmem major = GLOBALMEM MAJOR; 
/*globalmem 设备 结构 体 */ 
9 struct globalmem dev ( 








/* 多 局 内 存 大 小 : 4KB*/ 


/* 预 设 的 globalmem 的 主 设备 号 */ 








被 两 个 或 两 个 以 上 的 进程 
户 空 间 进程 进行 通信 的 一 种 鉴 脚 的 手段 。 

本 章 将 给 出 globalmem 设备 驱动 的 雏形 ， 而 后 续 章 节 会 在 这 个 雏形 的 基础 上 添加 
由 等 复杂 功能 。 








解 问题 的 方 
































字符 设备 驱动 中 ， 应 包含 它 要 使 用 的 头 文件 ， 并 定义 globalmem 设备 结构 体 及 








20 struct cdev cdev; /*cdev 结构 体 */ 

21 unsigned char mem[GLOBALMEM SIZE]; /* 全 局 内 存 */ 

22 | 

23 

24 struct globalmem dev dev; /* 设 备 结 构 体 实例 */ 

从 第 19—22 行 代码 可 以 看 出 ， 定 义 的 globalmem dev 设备 结构 体 包 含 了 对 应 于 globalmem € 











符 设 备 的 cdev、 使 用 的 内 存 mem[GLOBALMEM SIZE] 。 当 然 ， 程 序 中 并 不 一 定 要 把 
但 这 样 定 义 的 好 处 在 于 ， 它 借用 了 


mem[GLOBALMEM _ SIZE] 和 cdev 包含 在 一 个 设备 结构 体 中 ， 
面向 对 象 程序 设计 中 “封装 ”的 思想 ， 体 现 了 一 种 良好 的 编程 





















































习惯 。 
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6.3.2 ”加 载 与 卸载 设备 驱动 
globalmem 设备 驱动 的 模块 加 载 和 钊 载 函数 遵循 代码 
码 清单 6.5 完全 一 致 ， 如 代码 清单 6.9 所 示 。 


代码 清单 6.9 _ globalmem 设备 驱动 模块 加 载 与 卸载 函数 
/*globalmem 设备 驱动 模块 加 载 函 数 */ 


int globalmem init (void) 
{ 


int result; 











单 6.5 的 类 似 模板 ， 其 实现 的 工作 与 代 





x 










































































dev t devno = MKDEV (globalmem major, 0); 














/* 申请 字符 设备 驱动 区 域 */ 
if (globalmem major) 








SOOO wg OY. UT A a E 


result = register chrdev region(devno, 1, "globalmem"); 
else { 
/* 动态 获得 主 设备 号 */ 
result = alloc chrdev region(&devno, 0, 1, "globalmem"); 
globalmem major = MAJOR (devno); 
} 
if (result « 0) 
return result; 


COL te » COS cO B^ pe 


globalmem setup cdev(); 





«o 


return 0; 

29 3 

2.4. 

22 /*globalmem 设备 驱动 模块 卸载 函数 */ 
23 void globalmem exit (void) 
24 ( 

25  cdev del(&dev.cdev); /删除 caev 结构 */ 

26  unregister chrdev region (MKDEV(globalmem major，0)，1);/* 注 销 设备 区 域 */ 
22 3 


第 18 行 调 用 的 globalmem setup cdevO PE ŽE cdev 的 初始 化 和 添加 ， 如 代码 清单 6.10 所 示 。 


代码 清单 6.10 ”初始 化 并 添加 cdev 结构 体 
/* 初 始 化 并 添加 cdev 结构 体 */ 


2 static void globalmem setup cdev() 
































Ny 








SET 

4 int err, devno - MKDEV (globalmem major, 0); 

5 

6 cdev init(&dev.cdev, &globalmem fops); 

7 dev.cdev.owner - THIS MODULE; 

8 err = cdev add(&dev.cdev, devno, 1); 

9 abs. (ewe) 

10 printk(KERN NOTICE "Error $d adding globalmem", err); 
JEJE 3 





在 cdev_init0 函 数 中 ， 与 globalmem 的 cdev 关联 的 file operations 结构 体 如 代码 清单 6.11 所 示 。 
代码 清单 6.11 globalmem 设备 驱动 文件 操作 结构 体 


1 static const struct file operations globalmem fops = { 
2 .owner = THIS MODULE, 
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e 
© 
3 .llseek = globalmem llseek, o 
4 .read = globalmem read, 
5 .write = globalmem write, 
6 .ioctl - globalmem ioctl, 
LE, 
6.3.8 ŠHK% 
globalmem 设备 驱动 的 读 写 函数 主要 是 让 设备 结构 体 的 memf[] 数 组 与 用 户 空 间 交 互 数据 ， 并 
随 着 访问 的 字 节 数 变更 返回 给 用 户 的 文件 读 写 偏 移 位 置 。 读 和 写 函 数 的 实现 分 别 如 代码 清单 6.12 
和 6.13 所 示 。 
代码 清单 6.12. globalmem 设备 驱动 读 函 数 
1 static ssize t globalmem read(struct file *filp, char user *buf, size t count, 
2 kowe ce Sos) 
Sk Wt 
4 unsigned long p - *ppos; 
5 int ret = 0; 
6 
7 /* 分 析 和 获取 有 效 的 读 长 度 */ 
8 if (p >= GLOBALMEM SIZE) /* 要 读 的 偏 移 位 置 越界 
9 return 0; 
0 if (count > GLOBALMEM SIZE - p)/* 要 读 的 字 节 数 太 大 
1l count = GLOBALMEM SIZE - p; 
2 
3 /* 内 核 空间 一 用 户 空间 */ 
4 if (copy to user(buf, (void*) (dev.mem * p), count)) 
S ret = - EFAULT; 
6 else ( 
g *ppos *- count; 
8 ret = count; 
9 
20 printk(KERN INFO "read $d bytes(s) from $dMn", count, p); 
24 ) 
22 
23) return ret; 
24 ] 
代码 清单 6.13 globalmem 设备 驱动 写 函 数 
1 static ssize t globalmem write(struct file *filp, const char | user *buf, 
2 Guys qe Corie omii. AJIDE) 
S 
4 unsigned long p = *ppos; 
5 int ret = 0; 
6 
7 /* 分 析 和 获取 有 效 的 写 长 度 */ 
8 if (p >= GLOBALMEM SIZE)  /* 要 写 的 偏 移 位 置 越界 
9g return 0; 
10 if (count > GLOBALMEM SIZE - p) /* 要 写 的 字 节 数 太 多 
dbi count = GLOBALMEM SIZE - p; 
T2 
13 /* 用 户 空间 一 内 核 空间 */ 
14 if (copy from user(dev.mem * p, buf, count)) 
IINUX, 127 
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TS ret = - EFAULT; 

16 else ( 

Lg! *ppos += count; 

18 ret = count; 

19 

20 printk(KERN INFO "written $d bytes(s) from $dMn", count, p); 
21 } 

22 

259 return ret; 

24 ] 


6.3.4 seek HŽ 


seek0 函 数 对 文件 定位 的 起 始 地 址 可 以 是 文件 开头 (SEEK. SET，0)、 当 前 位 置 (SEEK_CUR， 
1) 和 文件 尾 (SEEK_END, 2), globalmem 支持 从 文件 开头 和 当前 位 置 相 对 偏 移 。 

在 定位 的 时 候 ， 应 该 检查 用 户 请 求 的 合法 性 ， 若 不 合法 ， 函 数 返回 - EINVAL， 合 法 时 返回 文 
件 的 当前 位 置 ， 如 代码 清单 6.14。 


代码 清单 6.14 globalmem 设备 驱动 seek() 函 数 














































































































static loff t globalmem llseek(struct file *filp, loff t offset, int orig) 
( 

loff t ret; 

Switch (orig) ( 


T 
2 
3 
4 
6 case 0:  /* 从 文件 开头 开始 偏 移 */ 
7 
8 
9 




















TERNO BSST xs 0 3 


























ret = - EINVAL; 
break; 
0 } 
T if ((unsigned int)offset > GLOBALMEM SIZE) { 
2 ret = - EINVAL; 
3 break; 
4 l 
5 filp-»5f pos = (unsigned int)offset; 
6 ret - filp-»f pos; 
7 break; 
8 case 1: /*# 从 当前 位 置 开 始 偏 移 */ 
9 if ((filp-»f pos * offset) » GLOBALMEM SIZE) { 
20 ret = - EINVAL; 
21 break; 
212 } 
22 (a Oe s» Oaet) < 0) 1 
24 ret = - EINVAL; 
IE) break; 
26 } 
2d filp->f pos += offset; 
28 ret c rilp-5t pos; 
2/9 break; 
30 default: 
St ret = - EINVAL; 
22 } 
33 return ret; 
34 ] 
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6.3.5 ioctl 函数 
1. globalmem 设备 驱动 的 ioctl() ER Zt 
globalmem 设备 驱动 的 ioctl0 函 数 接受 MEM. CLEAR 命令 ， 这 个 命令 会 将 全 局 内 存 的 有 效 数 
据 长 度 清 0， 对 于 设备 不 支持 的 命令 ，ioctl0) 函 数 应 该 返回 - EINVAL， 如 代码 清单 6.15 Br. 


代码 清单 6.15 ”globalmem 设备 驱动 的 1/0 控制 函数 




































































1 static int globalmem ioctl(struct inode *inodep, struct file *filp, unsigned 
2 int cmd, unsigned long arg) 

ST 

4 Switch (cmd) ( 
5 case MEM CLEAR: 
6 
F 
8 





/* 清除 全 局 内 存 
memset (dev->mem, 0, GLOBALMEM SIZE); 
printk(KERN INFO "globalmem is set to zeroWMn"); 

















9 break; 

10 

AE 3L default: 

12 return - EINVAL; /* 其 他 不 支持 的 命令 
13 } 

14 return 0; 

As 3 











在 上 述 程序 中 ，MEM_CLEAR 被 宏 定义 为 0x01， 实 际 上 并 不 是 一 种 值得 推荐 的 方法 ， 简 单 
地 对 命令 定义 为 0x0、0x1、0x2 等 类 似 值 会 导致 不 同 的 设备 驱动 拥有 相同 的 命令 号 。 如 果 设 备 A、 
B 都 支持 0x0、0x1、0x2 这 样 的 命令 ,假设 用 户 本 身 希望 给 A 发 0xl 命令 ， 可 是 不 经 意 间 发 给 了 
B， 这 个 时 候 B 因为 支持 该 命令 ， 它 就 会 执行 该 命令 。 因 此 ，Linux 内 核 推荐 采用 一 套 统一 的 ioctl) 
命令 生成 方式 。 

2. ioctl() 命 令 

Linux 建议 以 如 图 6.2 所 示 的 方式 定义 ioctl0 的 命令 。 



































































































































8bit 8bit 2bit 


设备 类 型 序列 号 方向 数据 尺寸 
13/14bit 








6.2 1O 控制 命 合 的 组 成 














命令 码 的 设备 类 型 字段 为 一 个 “ 幻 数 ”， 可 以 是 0 一 0x 任 之 间 的 值 ， 内 核 中 的 ioctl-number.txt 
给 出 了 一 些 推荐 的 和 已 经 被 使 用 的 “ 约 数 ” 新 设备 驱动 定义 “ 约 数 ”的 时 候 要 避免 与 其 冲突 。 
命令 码 的 序列 号 也 是 8 位 宽 。 
命令 码 的 方向 字段 为 2 位 ， 该 字段 表示 数据 传送 的 方向 ， 可 能 的 值 是 IJOC_NONE (无 数据 传 
输 )、IOC READ (i£). IOC WRITE (5) fll IOC READ| IOC WRITE (双向 )。 数 据 传送 的 
方向 是 从 应 用 程序 的 角度 来 看 的 。 
命令 码 的 数据 长 度 字 段 表示 涉及 的 用 户 数据 的 大 小 ， 这 个 成 员 的 宽度 依赖 于 体系 结构 ， 通 常 
是 13 14 位 。 
内 核 还 定义 了 _IO0、_IORO、_IOW0O 和 _IOWRO 这 4 个 宏 来 辅助 生成 命令 ， 这 4 个 宏 的 通用 
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定义 如 代码 清单 6.16 所 示 。 








代码 清单 6.16 1O(.. IORQ.. IOWOQRI. IOWR()Z E X. 


define IO(type,nr) mIOQ( C IOCTNONBZ(Eype) mb) 

define IOR(type,nr,size)  IOC( IOC READ, (type), (nr),^N 
(_I0C-TYPECHECK(s1i2z67)) 

define IOW(type,nr,size) | IOC( IOC WRITE, (type) , N 

(_IOC TYPECHECK (size))) 

define IOWR(type,nr,size)  IOC( IOC READ| IOC WRITE, (type), (nr), Nw 
(_IOC_TYPECHECK (size) ) ) 














/* IO. IOR 等 使 用 的 _IOC 宏 */ 
define IOC(dir,type,nr,size) N 











es al va Re OA OI ET OE DG Bg pb 



































0 (((dir) << _IOC DIRSHIFT) | N 
( (type) << IOC TYPESHIFT) | \ 
2 ((nr) << _IOC NRSHIFT) | N 
3 ((size) << IOC SIZESHIFT)) 
此 可 见 ， 这 几 个 宏 的 作用 是 根据 传 入 的 type《〈 设 备 类 型 字段 )、nr〈 序 列 号 字段 ) 和 size 〈 数 








据 长 度 字 段 ) 和 宏 名 隐 含 的 方向 字段 移 位 组 合生 成 命令 码 
于 globalmem 的 MEM CLEAR 命令 不 涉及 数据 传输 ， 因此 它 可 以 定义 为 : 


define GLOBALMEM MAGIC .. 
define MEM CLEAR _IO (GLOBALMEM MAGIC, 0) 


3. 预定 义 命 令 

内 核 中 预定 义 了 一 些 IO 控制 命令 ， 如 果菜 设备 驱动 中 包含 了 与 预定 义 命令 一 样 的 命令 人 码 ， 
这 些 命令 会 被 当 作 预 定义 命令 被 内 核 处 理 而 不 是 被 设备 驱动 处 理 ， 预 定义 命令 有 如 下 4 种 。 
(1) FIOCLEX: HJ File IOctl Close on Exec， 对 文件 设置 专用 标志 ， 通 知 内 核 当 exec0O 系 统 调 
用 发 生 时 自动 关闭 打开 的 文件 。 
(2) FIONCLEX: 即 File IOctl Not CLose on Exec, +j FIOCLEX 标志 相反 ， 清 除 由 FIOCLEX 
命令 设置 的 标志 。 

(3) FIOQSIZE: 获得 一 个 文件 或 者 目录 的 大 小 ， 当 用 于 设备 文件 时 ， 返 回 一 个 ENOTTY 错误 。 

(4) FIONBIO: HJ File IOctl Non-Blocking WO， 这 个 调用 修改 在 filp->f flags 中 的 O_ NONBLOCK 





























































































































































































































标志 。 
FIOCLEX, FIONCLEX, FIOQSIZE 和 FIONBIO 这 些 宏 的 定义 为 : 
#define FIONCLEX 0x5450 
#define FIOCLEX 0x5451 
#define FIOQSIZE 0x5460 
#define FIONBIO 05421 


6.3.6 ”使 用 文件 私有 数据 


6.3.1—6.3.5 节 给 出 的 代码 完整 地 实现 了 预期 的 globalmem 纵 形 ， 在 其 代码 中 ， 为 globalmem 
设备 结构 体 globalmem dev 定义 了 全 局 实例 dev( 见 代码 清单 6.7 98 2547), 而 globalmem 的 驱动 
read0、write0、ioctIO、1lseekO 函 数 都 针对 dev 进行 操 人 
实际 上 ,大 多 数 Linux 驱动 工程 师 遵循 一 个 “ 潜 规 则 ”， 那 就 是 将 文件 的 私有 数据 private_data 

站 向 设备 结构 体 ， 在 read(). write(). ioctl). llseek() 5 PR AGBS E. private data 访问 设备 结构 体 。 
这 个 时 候 ， 我 们 要 将 各 函数 进行 少量 的 修改 ， 为 了 让 读者 朋友 建立 字符 设备 驱动 的 全 貌 视 
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图 ， 代 码 清单 6.17 列 出 了 完整 的 使 用 文件 私有 数据 的 globalmem 的 设备 驱动 ， 本 程序 位 于 虚拟 
机 /home/lihacker/develop/svn/1dd6410-read-only/training/kernel/drivers/globalmem/ch6 目录 。 


代码 清单 6.17 ”使 用 文件 私有 数据 的 globalmem 的 设备 驱动 


«linux/module.h» 


















































00G 














includ 
linux/types.h» 
Iinuxfish 


finclud 
includ 
includ linux/errno.h» 
linux/mm.h» 


linux/sched.h» 


includ 
includ 


includ Iinux/imit.h- 





JU AS AV MEAS AN AS EAS 


includ linux/cdev.h» 


AO. CODO E C O* Ota 5 NX Jj 


#include «asm/io.h» 


include «asm/system.h» 








DD CD ED NS CD IOS CD MEN CD Re CD MED MK (D 


include «asm/uaccess.h» 





define GLOBALMEM SIZE 0x1000 ”/* 全 局 内 存 最 大 AKB*/ 
define MEM CLEAR 0x1 /* 清 零 全 局 内 存 */ 
define GLOBALMEM MAJOR 250 /* 预 设 的 globalmem 的 主 设备 号 */ 

















static int globalmem major = GLOBALMEM MAJOR; 
/*globalmem 设备 结构 体 */ 
struct globalmem dev { 

struct cdev cdev; /*cdev 结构 体 */ 

unsigned char mem[GLOBALMEM SIZE]; /* 全 局 内 存 */ 


O^ ge Cs GO RX qe 65 





«o 





oa 
se 


; 


No MN 
Ae Ww 


struct globalmem dev *globalmem devp; /* 设 备 结构 体 指针 */ 

/* 文 件 打开 函数 */ 

int globalmem open(struct inode *inode, struct file *filp) 
( 














No PN 
Oo On 


DD 
0 x 


/* 将 设备 结构 体 指针 赋值 给 文件 私有 数据 指针 */ 
filp->private data = globalmem devp; 


N 
I) 


return 0; 
} 
/* 文 件 释放 函数 */ 
int globalmem release(struct inode *inode, struct file *filp) 
( 


return 0; 


} 


/* ioctl 设备 控制 函数 */ 


static int globalmem ioctl(struct inode *inodep, struct file *filp, unsigned 


B CQ) C0 C) Q0) (0 C0 Q0 CO Q0 CO 
(CONSO ED Xon, OT, cs Aa nS Sperre 





int cmd, unsigned long arg) 
41 { 
42 struct globalmem dev *dev = filp->private data;/* 获 得 设备 结构 体 指针 */ 
43 
44 switch (cmd) ( 
45 case MEM CLEAR: 
46 memset (dev->mem, 0, GLOBALMEM SIZE); 
47 printk(KERN INFO "globalmem is set to zeroWMn"); 
48 break; 
49 
50 default: 
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51. return - EINVAL; 

52 ) 

I6) 

54 return 0; 

S3. ] 

56 

57 /*iEER AUS / 

58 static ssize t globalmem read(struct file *filp, char | user *buf, size t size, 

















59 lopit 3e, lO) 

Go 

61 unsigned long p = *ppos; 

62 unsigned int count - size; 

63 int ret - 0; 

64 struct globalmem dev *dev = filp-»private data;/* 获 得 设备 结构 体 指针 */ 
65 

66 /* 分 析 和 获取 有 效 的 写 长 度 */ 

671 if (p >= GLOBALMEM SIZE) 

68 return 0; 

69 if (count » GLOBALMEM SIZE - p) 

70 count = GLOBALMEM SIZE - p; 

jani 

72 /*# 内 核 空 间 一 用 户 空 间 */ 

jS. if (copy to user(buf, (void *) (dev-»mem + p), count)) { 
74 ret = - EFAULT; 

15 j elec i 

76 *ppos t- count; 

d Ic MOM 

78 

yS) printk(KERN INFO "read $u bytes(s) from $1uWMn", count, p); 
80 } 

81 

82 return ret; 

Sr]; 

84 


85 /* 写 函数 */ 
86 static ssize t globalmem write(struct file *filp, const char ss *buf, 














87 size t size, loff t *ppos) 

88 | 

89 unsigned long p = *ppos; 

90 unsigned int count - size; 

91 int ret = 0; 

92 struct globalmem dev *dev = filp-»private data;/* 获 得 设备 结构 体 指针 */ 
9S 

94 /* 分 析 和 获取 有 效 的 写 长 度 */ 

95 if (p >= GLOBALMEM SIZE) 

96 return 0; 

Gi if (count » GLOBALMEM SIZE - p) 

98 count = GLOBALMEM SIZE - p; 

99 

100 /* 用 户 空间 一 内 核 空间 */ 

101 if (copy from user(dev-»mem + p, buf, count)) 
102 ret = - EFAULT; 

DO else { 

104 *ppos *- count; 

105 ret = count; 
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000 




















06 

07 printk(KERN INFO "written $u bytes(s) from $1uWMn", count, p); 
08 } 

09 

0 return ret; 

LE; 

2 

3 /* seek 文件 定位 函数 */ 

4 static loff t globalmem llseek(struct file *filp, loff t offset, int orig) 
B 

6 loff t ret - 0; 

7 SWECO E, 

8 case 0:  /* 相 对 文件 开始 位 置 偏 移 */ 

9 fset < 0 { 
20 ret = - EINVAL; 
li break; 
22 } 
23 if ((unsigned int)offset > GLOBALMEM SIZE) { 
24 ret = - EINVAL; 
25 break; 
26 } 
2 filp-»f pos = (unsigned int)offset; 
28 ret = filp-»f pos; 

2:9 break; 

30 case 1: ”/* 相 对 文件 当前 位 置 偏 移 */ 

n if ((filp-^f pos * offset) » GLOBALMEM SIZE) 1 
32 ret = - EINVAL; 

33 break; 

34 j 

B5 at (Q(ueudgol4t qp9xour a qeirexer) « 0» 1 
36 ret = - EINVAL; 

SH break; 

38 j 

39 filp-^f pos -*- offset; 

40 ret - filp-»^f pos; 

41 break; 

42 default: 

43 ret = - EINVAL; 

44 break; 

45 } 

46 return ret; 

47 ) 

48 

49 /* 文 件 操作 结构 体 */ 





50 static const struct file operations globalmem fops - d 


>T .owner = THIS MODULE, 

52 .llseek - globalmem llseek, 
53 .read = globalmem read, 

54 .write = globalmem write, 

55 .ioctl - globalmem ioctl, 

56 .open = globalmem open, 

3 .release = globalmem release, 
58 ); 

uw 





60 /* 初 始 化 并 注册 cdev*/ 
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61 static void globalmem setup cdev(struct globalmem dev *dev, int index) 
2 í 

63 int err, devno = MKDEV(globalmem major, index); 

64 

65 cdev init(&dev-»cdev, &globalmem fops); 

66 dev-»cdev.owner = THIS MODULE; 

67 err = cdev add(&dev-»cdev, devno, 1); 

68 if (err) 

69 printk(KERN NOTICE "Error $d adding globalmem $d", err, index); 
EINE 

71 

72 /* 设 备 驱动 模块 加 载 函 数 */ 

73 int globalmem init (void) 

aet 

m5; int result; 

76 dev t devno = MKDEV (globalmem major, 0); 

A 

78 /* 申请 设备 号 */ 

TS) if (globalmem major 

80 result = register chrdev region(devno, 1, "globalmem"); 
81 else ( /* 动态 申请 设备 号 */ 

82 result - alloc chrdev region(&devno, 0, 1, "globalmem"); 
83 globalmem major - MAJOR (devno); 

84 ) 

85 Xf (result < 0) 

86 return result; 

87 

88 /* 动态 申请 设备 结构 体 的 内 存 */ 

89 globalmem devp = kmalloc(sizeof(struct globalmem dev), GFP KERNEL); 
90 if (!globalmem devp) ( /* 申 请 失败 */ 

gmi result = - ENOMEM; 

92 goto fail malloc; 

93 } 

94 

95 memset(globalmem devp, 0, sizeof(struct globalmem dev)); 

96 

97 globalmem setup cdev (globalmem devp, 0); 

98 return 0; 

ENS 
200 fail malloc: 
201 unregister chrdev region(devno, 1); 
202 return result; 
ec m 
204 


205 /*BiBH A / 


206 void globalmem exit (void) 





A 

208 cdev del(&globalmem devp-»cdev);  ”/* 注 销 cdev*/ 

209 kfree (globalmem devp); /* 释 放 设 备 结构 体内 存 */ 

210 unregister chrdev region (MKDEV(globalmem major, 0), 1); /* RIO% 5 */ 
ZA y 

ZA 


213 MODULE AUTHOR("Barry Song «21cnbao8gmail.com»"); 
214 MODULE LICENSE("Dual BSD/GPL"); 
AIRE) 
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216 module param(globalmem major, int, S IRUGO); 
21:7 
218 module init (globalmem init); 


eo 


219 module exit (globalmem exit); 

除了 在 globalmem_open0 函 数 中 通过 filp-»private data = globalmem devp 语句 〈 见 第 29 £1) 
将 设备 结构 体 指针 赋值 给 文件 私有 数据 指针 并 在 globalmem read(). globalmem write()、 
globalmem llseek() 和 globalmem ioctl() 函 数 中 通过 struct globalmem dev *dev = filp->private_data 
语句 获得 设备 结构 体 指针 并 使 用 该 指针 操作 设备 结构 体外 ， 代 码 清单 6.17 与 代码 清单 6.7 一 6.15 
的 程序 基本 相同 。 















































































































































读者 朋友 们 ,这 个 时 候 ， 请 您 翻 回 到 本 书 的 第 1 章 ， 再 次 阅读 代码 清单 1.4, 即 Linux 下 
LED 的 设备 驱动 ， ESRAR? 




















[sr 

















代码 清单 6.17 仅仅 作为 使 用 private data 的 范例 ， 实 际 上 ， 在 这 个 程序 中 使 用 private data 7 
有 任何 意义 ， 直 接 访 问 全 局 变量 globalmem devp 会 更 加 结构 清晰 。 如 果 globalmem 不 只 包括 一 个 
设备 ， 而 是 同时 包括 两 个 或 两 个 以 上 的 设备 ， 采 用 private data 的 优势 就 会 集中 显现 出 来 。 
在 不 对 代码 清单 6.17 中 的 globalmem read(). globalmem write(). globalmem ioctl0 等 重要 函数 
及 globalmem fops 结构 体 等 数据 结构 进行 任何 修改 的 前 提 下 ， 只 是 简单 地 修改 globalmem init(). 
globalmem_exit0 和 globalmem_open0， 就 可 以 轻松 地 让 globalmem 驱动 中 包含 两 个 同样 的 设备 
(次 设备 号 分 别 为 0 和 1)， 如 代码 清单 6.18 所 示 。 
































































































































































































































代码 清单 6.18 ”支持 2 个 globalmem 设备 的 globalmem 驱动 
/* 文 件 打开 函数 */ 
int globalmem open(struct inode *inode, struct file *filp) 
( 














/* 将 设备 结构 体 指针 赋值 给 文件 私有 数据 指针 */ 


struct globalmem dev *dev; 


dev = container of(inode-»i cdev,struct globalmem dev,cdev); 
filp-»private data = dev; 


«0 0 00 € N D| 


return 0; 


} 


/* 设 备 驱动 模块 加 载 函 数 */ 
int globalmem init (void) 
{ 
int result; 
dev t devno = MKDEV (globalmem major, 0); 

















ce -10 01 4» tQ) I| oO 





/* 申请 设备 号 */ 


g if (globalmem major) 





20 result = register chrdev region(devno, 2, "globalmem"); 
2 else ( /* 动态 申请 设备 号 */ 

23 result = alloc chrdev region(&devno, 0, 2, "globalmem"); 
24 globalmem major = MAJOR (devno); 

25 } 

26 sue SS < 0 
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29) return result; 














29  /* 动态 申请 两 个 设备 结构 体 的 内 存 */ 
30 globalmem devp = kmalloc(2*sizeof(struct globalmem dev), GFP KERNEL); 





























31 if (!globalmem devp) ( /* 申 请 失败 */ 

33 result = - ENOMEM; 

34 goto fail malloc; 

25 } 

36 memset(globalmem devp, 0, 2*sizeof(struct globalmem dev)); 
3 


38 globalmem setup cdev(&globalmem devp[0], 0); 
39 globalmem setup cdev(&globalmem devp[1], 1); 




















40 return 0; 

41 

42 fail malloc: unregister chrdev region(devno, 1); 
43 return result; 

44 ] 

45 

46 /*BXIUE SR ER / 

47 void globalmem exit (void) 

48 { 

49 cdev del(&(globalmem devp[0].cdev)); 

50 cdev del(&(globalmem devp[1].cdev)); /* 注销 cdev */ 
51 kfree (globalmem devp); /* 释 放 设 备 结构 体内 存 */ 

52 unregister chrdev region(MKDEV(globalmem major, 0), 2); /* 释 放 设 备 号 */ 
53 

/* 其 他 代码 同 清单 6.16 */ 






































代码 清单 6.18 第 7 行 调用 的 container_ofO 的 作用 是 通过 结构 体 成 员 的 指针 找到 对 应 结构 体 的 
指针 ， 这 个 技巧 在 Linux 内 核 编 程 中 十 分 常用 。 在 container offinode->i_cdev,struct globalmem dev, 
cdev) 语 句 中 ， 传 给 container ofO 的 第 1 个 参数 是 结构 体 成 员 的 指针 ， 第 2 个 参数 为 整个 结构 体 的 
类 型 ， 第 3 个 参数 为 传 入 的 第 1 个 参数 即 结构 体 成 员 的 类 型 ， container of 返回 值 为 整个 结构 体 
的 指针 。 























































































































6.4 globalmem 驱动 在 用 户 空 间 的 验证 


在 对 应 目录 通过 “make” 命 令 编译 globalmem 的 驱动 ， 得 到 globalmem.ko 文件。 运行: 
lihackerG8lihacker-laptop: ~ /develop/svn/l1dd6410-read-only/training/kernel/drivers/ 





























globalmem/ch6$ sudo su 


rootGülihacker-laptop:/home/lihacker/develop/svn/1dd6410-read-only/training/kernel/d 
rivers/globalmem/ch6f insmod globalmem.ko 


命令 加 载 模块 ， 通 过 “lsmod” 命 令 ， 发 现 globalmem 模块 已 被 加 载 。 再 通过 “cat /proc/devices " 


命令 查看 ， 发 现 多 出 了 主 设备 号 为 250 的 “globalmem” 字 符 设备 驱动 : 
root@lihacker-laptop:/home/lihacker/develop/svn/1dd6410-read-only/training/kernel/d 







































































rivers/globalmem/ch6# cat /proc/devices 





Character devices: 
1 mem 
4 /dev/vc/0 
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4 tty 

4 ttyS 

5 /dev/tty 

5 /dev/console 
5 

6 


eoo 


/dev/ptmx 
lp 
RVS 
TOETSE 
ES auget 
14 sound 
21 sg 
DONE 
99 ppdev 
108 ppp 
116 alsa 
128 ptm 
JL38. ee 
180 usb 
188 ttyUSB 
189 usb device 
216 rfcomm 
226 drm 
250 globalmem 


接 下 来 ， 通 过 命令 : 
root@lihacker-laptop:/home/lihacker/develop/svn/1dd6410-read-only/training/kernel/d 
rivers/globalmem/ch6# mknod /dev/globalmem c 250 0 


创建 “/dev/globalmem ”设备 节 点 ， 并 通过 “echo 'hello world' > /dev/globalmem ”命令 和 “cat 
/dev/globalmem ”命令 分 别 验 证 设备 的 写 和 读 ， 结 果 证 明 “hello world” 字 符 串 被 正确 地 写 入 
globalmem 字符 设备 : 
















































































root@lihacker-laptop:/home/lihacker/develop/svn/1dd6410-read-only/training/kernel/d 
rivers/globalmem/ch6# echo "hello world" > /dev/globalmem 











rootülihacker-laptop:/home/lihacker/develop/svn/1dd6410-read-only/training/kernel/d 
rivers/globalmem/ch6ft cat /dev/globalmem 
hello world 


如 果 启 用 了 sysfs 文件 系统 ， 将 发 现 多 出 了 /sys/module/globalmem 目录 ， 该 目录 下 的 树 型 结构 为 : 


l= Eerfent 























-- sections 

c 9s 

—— data 

-- .gnu.linkonce.this module 
Sen GOALA 

SE Trodat an SEEI] 

de) 

VGA 

E drip qu 


-- | versions 


refcnt 记录 了 globalmem 模块 的 引用 计数 ，sections 下 包含 的 数 个 文件 由 
包含 的 BSS、 数 据 段 和 代码 段 等 的 地 址 及 其 他 信息 。 
对 于 代码 清单 6.18 给 出 的 支持 两 个 globalmem 设备 的 驱动 ， 在 加 载 模块 后 需 创 建 两 个 设备 节 
点 ，/dev/globalmem0 对 应 主 设备 号 globalmem_major， 次 设备 号 0，/dev/globalmeml 对 应 主 设 备 
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给 出 了 globalmem 所 
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号 globalmem_major， 次 设备 号 1。 分 别 读 写 /dev/globalmem0 和 /devwglobalmem1， 发 现 都 读 写 到 
了 正确 的 对 应 的 设备 。 


Ns] z 


字符 设备 是 3 大 类 设备 〈 字 符 设 备 、 块 设备 和 网 络 设备 ) 中 较 简 单 的 一 类 设备 ， 其 驱动 程序 
中 完成 的 主要 工作 是 初始 化 、 添 加 和 删除 cdev 结构 体 ， 申请 和 释放 设备 号 ， 以 及 填充 file operations 
寺 构 体 中 的 操作 函数 ， 实 现 file operations 结构 体 中 的 read0、write0 和 ioct10 等 函数 是 驱动 设计 
的 主体 工作 。 
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Linux 设备 驱动 中 必须 解决 的 
发 的 访问 会 导致 竞 态 ， 即 使 是 经 验 丰 




































































天、 原子 操作 、 











问题 bug 的 引 

Linux 提供 了 多 种 解 坟 
景 。7.1 节 讲 解 了 并 发 和 竞 态 的 概念 及 发 9 
衬 旋 锁 和 信号 量 等 并 发 控制 机 制 。7.6 节 讲 解 增 
的 globalmem 的 设备 驱动 。 
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个 问题 是 多 个 进程 对 共享 资源 的 
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区 动 程序 。 
竞 态 问题 的 方式 ， 这 上 
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7.2 一 7.5 "849 
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旦 师 也 常常 设计 








方式 适合 不 同 的 应 用 
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并 发 与 竞 态 

















并 发 〈concurrency) 指 的 是 多 个 执行 单元 同时 、 并 行 被 执行 ， 而 并 发 的 执行 单元 对 共享 资源 
(硬件 资源 和 软件 上 的 全 局 变量 、 静 态 变 量 等 ) 的 访问 则 很 容易 导致 竞 态 (race conditions)。 例 如 ， 
对 于 globalmem 设备 ， 假 设 一 个 执行 单元 A 对 其 写 入 3 000 个 字符 “a”， 而 男 一 个 执行 单元 B 对 
其 写 入 4 000 个 “b” 第 三 个 执行 单元 C 读 取 globalmem 的 所 有 字符 。 如 果 执 行 单元 A、B 的 写 
操作 如 图 7.1 那样 顺序 发 生 ， 执 行 单元 C 的 读 操 作 当 然 不 会 有 什么 问题 。 但 是 ， 如 果 执 行 单元 A. 
B 如 图 7.2 那样 被 执行 ， 而 执行 单元 C 又 “不 合 时 宜 ” 地 读 ， 则 会 读 出 3 000 个 “b”。 
















































































































































































执行 单元 A 执行 单元 B 执行 单元 C 


copy from. user (dev-  mem*p, buf, count) 





dev--current. len-p*count 









copy from user (dev— mem*p, 


dev—- current. len-p*count 


read. globalmem () 


图 7.1 并 发 执行 单元 的 顺序 执行 


执行 单元 ^ T7 Ron B iT Éi E 
copy—from_user{dev- > mentp, bul, count ) 
po copy from. user (dev. >mentp, buf, count) 
dev-z-current. Jen- p*count 








dev--7 current. len-p*count 


E 7.2 并 发 执行 单元 的 交错 执行 


























比 图 7.2 更 复杂 、 更 混乱 的 并 发 大 量 地 存在 于 设备 驱动 中 ， 只 要 并 发 的 多 个 执行 单元 存在 对 
k 享 资源 的 访问 ， 竞 态 就 可 能 发 生 。 在 Linux 内 核 中 ， 主 要 的 竞 态 发 生 于 如 下 几 种 情况 。 
1. 对 称 多 处 理 器 (SMP) 的 多 个 CPU 
SMP 是 一 种 紧 耦 合 、 共 享 存储 的 系统 模型 ， 其 体系 结构 如 图 7.3 所 示 ， 它 的 特点 是 多 个 CPU 
使 用 共同 的 系统 总 线 ， 因 此 可 访问 共同 的 外 设 和 储存 器 。 






















































































































































































7.8 SMP 体系 结构 
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2. 单 CPU 内 进程 与 抢占 它 的 进程 

Linux 2.6 内 核 支持 抢占 调度 ， 一 个 进程 在 内 核 执 行 的 时 候 可 能 被 另 一 高 优先 级 进程 打 断 ， 进 
程 与 抢占 它 的 进程 访问 共享 资源 的 情况 类 似 于 SMP 的 多 个 CPU。 

3. 中 断 〈 硬 中 断 、 软 中 断 、Tasklet、 底 半 部 ) 与 进程 之 间 

中 断 可 以 打 断 正在 执行 的 进程 ， 如 果 中 断 处 理 程 序 访 问 进程 正在 访问 的 资源 ， 则 竞 态 也 会 发 生 。 

此 外 ， 中 断 也 有 可 能 被 新 的 更 高 优先 级 的 中 断 打 断 ， 因 此 ， 多 个 中 断 之 间 本 身 也 可 能 引起 
发 而 导致 竞 态 。 

上 述 并 发 的 发 生 情况 除了 SMP 是 真正 的 并 行 以 外 ， 其 他 的 都 是 “宏观 并 行 ， 微 观 串 行 ” 的 ， 
但 其 引发 的 实质 问题 和 SMP 相似 。 

解决 竞 态 问题 的 途径 是 保证 对 共享 资源 的 互 斥 访问 ， 所 谓 互 斥 访问 是 指 一 个 执行 单元 在 访问 
k 享 资源 的 时 候 ， 其 他 的 执行 单元 被 禁止 访问 。 

访问 共享 资源 的 代码 区 域 称 为 临界 区 Ceritical sections)， 临 界 区 需要 被 以 某 种 互 斥 机 制 加 以 
保护 。 中 断 屏 项、 原子 操作 、 自 旋 锁 和 信号 量 等 是 Linux 设备 驱动 中 可 采用 的 互 斥 途 径 ，7.2 一 7.5 
节 将 一 一 讲解 这 些 方法 。 


中 断 屏蔽 


在 单 CPU 范围 内 避免 竟 态 的 一 种 简单 而 省 事 的 方法 是 在 进入 临界 区 之 前 屏蔽 系统 的 中 断 。CPU 
一 般 都 具备 屏蔽 中 断 和 打开 中 断 的 功能 ， 这 项 功能 可 以 保证 正在 执行 的 内 核 执 行路 径 不 被 中 断 处 理 
程序 所 抢占 ,防止 某 些 竞 态 条 件 的 发 生 。 有 具体 而 言 , 中 断 屏蔽 将 使 得 中 断 与 进程 之 间 的 并 发 不 再 发 生 ， 
而 且 ， 由 于 Linux 内 核 的 进程 调度 等 操作 都 依赖 中 断 来 实现 ， 内 核 抢占 进程 之 间 的 并 发 也 得 以 避免 了 。 

中 断 屏蔽 的 使 用 方法 为 : 


local irg disable() /* 屏蔽 中 断 */ 
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un 






























































critical section /* 临界 区 */ 








local irq enable() /* 开 中 断 */ 
T Linux 的 异步 VO、 进程 调度 等 很 多 重要 操作 都 依赖 于 中 断 ,中断 对 于 内 核 的 运行 非常 重 
要 ， 在 屏蔽 中 断 期 间 所 有 的 中 断 都 无 法 得 到 处 理 ， 因 此 长 时 间 屏 蔽 中 断 是 很 危险 的 ， [能 造成 
数据 丢失 乃至 系统 骨 溃 等 后 果 。 这 就 要 求 在 屏 项 了 中 断 之 后 ， 当 前 的 内 核 执 行路 径 应 当 尽 快 地 执 
行 完 临 界 区 的 代码 。 

local irq_disable() 和 local_irq_enable() 都 只 能 禁止 和 使 能 本 CPU 内 的 中 断 ， 因 此 ， 并 不 能 解 
决 SMP 多 CPU 引发 的 竞 态 。 因 此 ， 单 独 使 用 中 断 屏蔽 通常 不 是 一 种 值得 推荐 的 避免 竟 态 的 方 
法 ， 它 适宜 与 下 文 将 要 介绍 的 自 旋 锁 联 合 使 用 。 
与 local irq disable0 不 同 的 是 ，local irq_save(flags) 除 了 进行 禁止 中 断 的 操作 以 外 ， 还 保存 日 
前 的 CPU 的 中 断 位 信息 ，local irq restore(flags) 进 行 的 是 与 local irq_ save(flags) 相 反 的 操作 。 
如 果 只 是 想 禁 止 中 断 的 底 半 部 ,应 使 用 local bh disable), 使 能 被 local_bh_disable() 禁 止 的 底 
半 部 应 该 调用 local bh enable()。 
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l-3 原子 操作 


原子 操作 指 的 是 在 执行 过 程 中 不 会 被 别 的 代码 路 径 所 中 断 的 操作 。 

Linux 内 核 提 供 了 一 系列 函数 来 实现 内 核 中 的 原子 操作 ， 这 些 函 数 又 分 为 两 类 ， 分 别针 对 位 
和 整 型 变量 进行 原子 操作 。 它 们 的 共同 点 是 在 任何 情况 下 操作 都 是 原子 的 ， 内 核 代 码 可 以 安全 地 
调用 它们 而 不 被 打 断 。 位 和 整 型 变量 原子 操作 都 依赖 底层 CPU 的 原子 操作 来 实现 ， 因 此 所 有 这 些 
函数 都 与 CPU 架构 密切 相关 。 


7.3.4 整 型 原子 操 
1. 设置 原子 变量 的 值 


void atomic set(atomic t *v, int i); /* WARI SEHEN ?*/ 
atomic t v = ATOMIC INIT(0); /* 定义 原子 变量 v 并 初始 化 为 0 */ 
2. 获取 原子 变量 的 值 
atomic read(atomic t *v); /* 返回 原子 变量 的 值 */ 
3. 原子 变量 加 / 减 
void atomic add(int i, atomic t yt 
void atomic sub(int i, atomic t *v); /* 原子 变量 减少 i */ 
4. 原子 变量 自 增 / 自 减 
void atomic inc(atomic t *v); /* 原子 变量 增加 1 */ 
void atomic dec(atomic t *v); /* 原子 变量 减少 1 */ 
5. 操作 并 测试 


int atomic inc and test(atomic t *v); 





























































































































int atomic dec and test(atomic t *v); 


int atomic sub and test(int i, atomic t *v); 
上 述 操 作对 原子 变量 执行 自 增 、 自 减 和 减 操 作 后 (注意 没有 加 〉 测试 其 是 否 为 0， 为 0 返回 
true, fll 3& [ul false. 

6. 操作 并 返回 


int atomic add return 
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int atomic inc return(atomic t *v); 


int atomic dec return(atomic t *v); 


上 述 操作 对 原子 变量 进行 加 / 减 和 自 增 / 自 减 操作 ， 并 返回 新 的 值 。 
7.3.0 ”位 原子 操作 


1. 设置 位 

void set bit(nr, void *addr); 

上 述 操作 设置 addr 地 址 的 第 nr 位 ， 所 谓 设置 位 即 是 将 位 写 为 1。 
2. 清除 位 


void clear bit(nr, void *addr); 


上 述 操作 清除 addr 地 址 的 第 nr 位 ， 所 谓 清 除 位 即 是 将 位 写 为 0。 
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3. 改变 位 

void change bit(nr, void *addr); 

上 述 操作 对 addr 地 址 的 第 nr 位 进行 反 置 。 
4. 测试 位 

test bit(nr, void *addr); 

上 述 操作 返回 addr 地 址 的 第 nr 位 。 

5. 测试 并 操作 位 

int test and set bit(nr, void *addr); 


int test and clear bit(nr, void *addr); 
int test and change bit(nr, void *addr); 


上 述 test and xxx bit(nr, void *addr) 操 作 等 同 于 执行 test bit(nr, void *addr) 后 再 执行 
xxx bit(nr, void *addr). 

代码 清单 7.1 给 出 了 原子 变量 的 使 用 例子 ， 它 用 于 使 得 设备 最 多 只 能 被 一 个 进程 打开 。 
代码 清单 7.1 使 用 原子 变量 实现 设备 只 能 被 一 个 进程 打开 


1 static atomic t xxx available = ATOMIC INIT(1); /* 定 义 原子 变量 */ 
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3 static int xxx open(struct inode *inode, struct file *filp) 

















d q 
9 yes 
6 if (l'atomic dec and test(&xxx available)) { 
7 atomic inc(&xxx available); 
8 return - EBUSY; /* 已 经 打开 */ 
9 } 
0 Ms 
1 return 0; /* Hj */ 
2 
3 
4 static int xxx release(struct inode *inode, struct file *filp) 
5 
16 atomic inc(&xxx available); /* 释放 设备 */ 
7 return 0; 
8 











TT 


7.4.1 ” 自 旋 锁 的 使 用 

HJEM (spin lock) 是 一 种 典型 的 对 临界 资源 进行 互 斥 访问 的 手段 ， 其 名 称 来 源 于 它 的 工作 
方式 。 为 了 获得 一 个 自 旋 锁 ,在 某 CPU 上 运行 的 代码 需 先 执行 一 个 原子 操作 ， 该 操作 测试 并 设置 
(test-and-set) 某 个 内 存 变量 ， 由 于 它 是 原子 操作 ， 所 以 在 该 操作 完成 之 前 其 他 执行 单元 不 可 能 访 
问 这 个 内 存 变 量 。 如 果 测 试 结果 表明 锁 已 经 空 闪 ， 则 程序 获得 这 个 自 旋 锁 并 继续 执行 ， 如 果 测 试 
结果 表明 锁 仍 被 占用 ， 程 序 将 在 一 个 小 的 循环 内 重复 这 个 “测试 并 设置 ”操作 ， 即 进行 所 谓 的 “ 自 
旋 ” 通俗 地 说 就 是 “在 原 地 打转 ”。 当 自 旋 锁 的 持 有 者 通过 重 置 该 变量 释放 这 个 自 旋 锁 后 ， 某 个 
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等 待 的 “测试 并 设置 ”操作 向 其 调用 者 报告 锁 已 释放 。 






























































里 解 自 旋 锁 最 简单 的 方法 是 把 它 作为 一 个 变量 看 待 ， 该 变量 把 一 个 临界 区 或 者 标记 为 “我 当 



































前 在 运行 ， 请 稍 等 一 会 ”或 者 标记 为 “我 当前 不 在 运行 ， 可 以 被 使 用 ”。 如 果 A 执行 单元 首先 进 
入 例 程 ， 它 将 持 有 自 旋 锁 ;， 当 B 执行 单元 试图 进入 同一 个 例 程 时 ， 将 获知 自 旋 锁 已 被 持 有 ， 需 等 
到 A 执行 单元 释放 后 才能 进入 。 



































































































































Linux 中 与 自 旋 锁 相关 的 操作 主要 有 以 下 4 种 。 
1. 定义 自 旋 锁 

cyonbistlGrelis 16 oo 

2. 初始 化 自 旋 锁 

SETFeeenaeOek) 

该 宏 用 于 动态 初始 化 自 旋 锁 lock. 

3. 获得 自 旋 锁 

Spin lock(lock) 

该 宏 用 于 获得 自 旋 锁 lock， 如 果 能 够 立即 获得 锁 ， 它 就 马上 返回 ， 否 则 ， 它 将 自 旋 在 那里 ， 





































































































到 该 自 旋 锁 的 保持 者 释放 。 




















统 ， 


IE o 


Spin trylock(lock) 
该 宏 尝试 获得 自 旋 锁 lock， 如 果 能 立即 获得 锁 ， 它 获得 锁 并 返回 真 ， 否 则 立即 返回 假 ， 实 际 




















上 不 再 “在 原 地 打转 ”。 





4. 释放 自 旋 锁 

spin unlock (lock) 

该 宏 释 放 自 旋 锁 lock， 它 与 spin_trylock 或 spin lock 配对 使 用 。 
自 旋 锁 一 般 这 样 被 使 用 : 
/* 定义 一 个 自 旋 锁 */ 
spinlock t lock; 

Spin lock init(&lock); 












































spin lock (&lock) ; /* 获取 自 旋 锁 ， 保 护 临 界 区 */ 

. ./* 临界 区 */ 
spin unlock (&lock) ; /* 解锁 */ 
自 旋 锁 主要 针对 SMP 或 单 CPU 但 内 核 可 抢占 的 情况 , 对 于 单 CPU 和 内 核 不 支持 抢占 的 系 
自 旋 锁 退 化 为 空 操作 。 在 单 CPU 和 内 核 可 抢占 的 系统 中 ， 自 旋 锁 持 有 期 间 内 核 的 抢占 将 被 禁 
由 于 内 核 可 抢占 的 单 CPU 系统 的 行为 实际 很 类 似 于 SMP 系统 ， 因 此 ， 在 这 样 的 单 CPU 系统 
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中 使 用 自 旋 锁 仍 十 分 必 
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要 。 




















尽管 用 了 自 旋 锁 可 以 保证 临界 区 不 受 别 的 CPU 和 本 CPU 内 的 抢占 进程 打扰 ， 但 是 得 到 锁 的 
































代码 路 径 在 执行 临界 区 的 时 候 ， 还 可 能 受到 中 断 和 底 半 部 CBH， 稍 后 的 章节 会 介绍 ) 的 影响 。 为 
了 防止 这 种 影响 ， 就 需要 用 到 自 旋 锁 的 衍生 。spin_lockO/spin_unlockO 是 自 旋 锁 机 制 的 基础 ， 它 们 


和 关中 断 local irq disableO/ 开 
























































Wi local irq_enable0 、 关 底 半 部 local bh disableQ/2T JX 2I & 


























local bh_enable0、 关 中 断 并 保存 状态 字 local irq_saveO/ 开 中 断 并 恢复 状态 local irq restore0) 结 合 

















就 











成 了 整套 自 旋 锁 机 制 ， 关 系 如 下 ; 

spin lock irq() = spin lock() -* local irq disable() 

spin unlock irq() -» spin unlock() -* local irq enable() 

Spin lock irqsave() = spin lock() + local irq save() 

spin unlock irqrestore() = spin unlock() + local irq restore() 
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spin lock bh() — spin lock() 4 local bh disable() 
spin unlock bh() = spin unlock() + local bh enable() 


spin lock irq(). spin lock irqsave(). spin lock bhO 类 似 函 数 会 为 自 旋 锁 的 使 用 系 好 “安全 带 ” 
以 避免 突入 其 来 的 中 断 驶 入 对 系统 造成 的 伤害 。 

驱动 工程 师 应 谨慎 使 用 自 旋 锁 ， 而 且 在 使 用 中 还 要 特别 注意 如 下 几 个 问题 。 

(1) 自 旋 锁 实际 上 是 忙 等 锁 ， 当 锁 不 可 用 时 ，CPU 一 直 循 环 执行 “测试 并 设置 ”该 锁 直 到 可 
用 而 取得 该 锁 ，CPU 在 等 待 自 旋 锁 时 不 做 任何 有 用 的 工作 ， 仅 仅 是 等 待 。 因 此 ， 只 有 在 占用 锁 的 
时 间 极 短 的 情况 下 ， 使 用 自 旋 锁 才 是 合理 的 。 当 临界 区 很 大 ， 或 有 共享 设备 的 时 候 ， 需 要 较 长 时 
间 占 用 锁 ， 使 用 自 旋 锁 会 降低 系统 的 性 能 。 
(2) 自 旋 锁 可 能 导致 系统 死 锁 。 引 发 这 个 问题 最 常见 的 情况 是 递归 使 用 一 个 自 旋 锁 ， 即 如 果 
个 已 经 拥有 某 个 自 旋 锁 的 CPU 想 第 二 次 获得 这 个 自 旋 锁 ， 则 该 CPU 将 死 锁 。 
G) 自 旋 锁 锁定 期 间 不 能 调用 可 能 引起 进程 调度 的 函数 。 如 果 进 程 获得 自 旋 锁 之 后 再 阻塞 ， 如 
调用 copy from user(). copy to user(). kmalloc()fll msleepO 等 函数 ， 则 可 能 导致 内 核 的 骨 溃 。 

代码 清单 7.2 给 出 了 自 旋 锁 的 使 用 例子 ， 它 被 用 于 实现 使 得 设备 只 能 被 最 多 1 个 进程 打开 ， 
等 同 于 代码 清单 7.1。 

代码 清单 7.2 ”使 用 自 旋 锁 实现 设备 只 能 被 一 个 进程 打开 
int xxx count = 0;/* 定 义 文件 打开 次 数 计数 */ 
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Set ime on eu moele mee ELE Aa) 
{ 


Spinlock(&xxx lock); 

if (xxx count) ( /*t2647JT*/ 
spin unlocki(sxxx. lock). 
teturi E EBUSY; 

















AO OD cs CON COT aS Go 机 


} 
xxx_count++;/* 增 加 使 用 计数 */ 
Spin unlock(&xxx lock); 

















return Or /* Hp ot 
H 


static int xxx release(struct inode *inode, struct file *filp) 
{ 


O a QT a SU 





Koj 


spinlock(&xxx lock); 
xxx count--; /* 减 少 使 用 计数 */ 


Spin unlock(&xxx lock) 














NO Mo NO 
BO vie LC 





No NO 
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return 0; 


N 
oa 
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7.4.0 读 写 自 旋 锁 

自 旋 锁 不 关心 锁定 的 临界 区 究竟 进行 怎样 的 操作 ， 不 管 是 读 还 是 写 ， 它 都 一 视 同仁 。 即 便 多 
个 执行 单元 同时 读 取 临界 资源 也 会 被 锁 住 。 实 际 上 ， 对 共享 资源 并 发 访问 时 ， 多 个 执行 单元 同时 
读 取 它 是 不 会 有 问题 的 ， 自 旋 锁 的 衍生 锁 读 写 自 旋 锁 (rwlock) 可 人 允许 读 的 并 发 。 读 写 自 旋 锁 是 
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一 种 比 自 旋 锁 粒度 更 小 的 锁 机 制 ， 它 保留 了 “ 自 旋 ”的 概念 ， 但 是 在 写 操作 方面 ， 只 能 最 多 有 1 
个 写 进 程 ， 在 读 操作 方面 ， 同 时 可 以 有 多 个 读 执行 单元 。 当 然 ， 读 和 写 也 不 能 同时 进行 。 

读 写 自 旋 锁 涉 及 的 操作 如 下 。 

1. 定义 和 初始 化 读 写 自 旋 锁 

rwlock t my rwlock = RW LOCK UNLOCKED; /* 静态 初始 化 */ 


rwlock t my rwlock; 
rwlock init(&my rwlock); /* 动态 初始 化 */ 


读 锁定 


void read lock(rwlock t *lock); 

































































void read lock irqsave (rwlock t *lock, unsigned long flags); 
void read lock irq(rwlock t *lock); 
void read lock bh(rwlock t *lock); 
读 解锁 
void read unlock(rwlock t *lock); 
void read unlock irqrestore(rwlock t *lock, unsigned long flags); 
void read unlock irq(rwlock t *lock); 
void read unlock bh(rwlock t *lock); 


在 对 共享 资源 进行 读 取 之 前 ， 应 该 先 调 用 读 锁定 函数 ， 完 成 之 后 应 调用 读 解锁 函数 。 

read lock irqsave(). read lock irq0 和 read lock bhO 也 分 别 是 read lockO 分 别 与 local irq save(). 
local irq_disable0 和 local bh _ disable0 的 组 合 ， 读 解锁 函数 read unlock irqrestore(). read unlock irq(). 
read unlock bhgO 的 情况 与 此 类 似 。 

4. 写 锁定 


void write lock(rwlock t *lock); 













































































void write lock irqsave(rwlock t *lock, unsigned long flags); 

void write lock irq(rwlock t *lock); 

void write lock bh(rwlock t *lock); 

int write trylock(rwlock t *lock); 

5. 写 解 锁 

void write unlock(rwlock t *lock); 

void write unlock irqrestore(rwlock t *lock, unsigned long flags); 

void write unlock irq(rwlock t *lock); 

void write unlock bh(rwlock t *lock); 

write lock irqsave(). write lock irq(). write lock bh() 2) 3] Z& write lock() 与 local irq save() . 
local irq_disable0 和 local_bh_disable0 的 组 合 ， 写 解锁 函数 write unlock irqrestore(). write unlock irq(). 
write unlock bhO 的 情况 与 此 类 似 。 

在 对 共享 资源 进行 写 之 前 ， 应 该 先 调 用 写 锁 定 函数 ， 完 成 之 后 应 调用 写 解 锁 函 数 。 和 spin trylock() 
一 样 ，write trylock0 也 只 是 尝试 获取 读 写 自 旋 锁 ， 不 管 成 功 失败 ， 都 会 立即 返回 。 


读 写 自 旋 锁 一 般 这 样 被 使 用 : 
rwlock t lock;  /* NX rwlock */ 
rwlock init(&lock); /* 初始 化 rwlock */ 




















































































































/* 读 时 获取 锁 */ 

read lock(&lock); 
/* 临界 资源 */ 

read unlock(&lock); 





/* 写 时 获取 锁 */ 
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write lock irqsave(&lock, flags); 
. /* 临界 资源 */ 
write unlock irqrestore(&lock, flags); 


7.4.3 顺序 锁 

顺序 锁 Cseglock) 是 对 读 写 锁 的 一 种 优化 ， 若 使 用 顺序 锁 ， 读 执行 单元 绝 不 会 被 写 执行 单元 
阻塞 ， 也 就 是 说 ， 读 执行 单元 在 写 执行 单 元 对 被 顺序 锁 保 护 的 共享 资源 进行 写 操作 时 仍然 可 以 继 
续 读 ， 而 不 必 等 待 写 执行 单元 完成 写 操作 ， 写 执行 单元 也 不 需要 等 待 所 有 读 执行 单元 完成 读 操 作 
才 去 进行 写 操作 。 
但 是 ， 写 执行 单元 与 写 执行 单元 之 间 仍 然 是 互 斥 的 ， 即 如 果 有 写 执行 单元 在 进行 写 操作 ， 其 
他 写 执行 单元 必须 自 旋 在 那里 ， 直 到 写 执行 单元 释放 了 顺序 锁 。 如 果 读 执行 单元 在 读 操作 期 间 ， 
写 执行 单元 已 经 发 生 了 写 操作 ， 那 么 ， 读 执行 单元 必须 重新 读 取 数据 ， 以 便 确保 得 到 的 数据 是 完 
整 的 。 这 种 锁 对 于 读 写 同时 进行 的 概率 比较 小 的 情况 ， 性 能 是 非常 好 的 ， 而 且 它 允许 读 写 同时 进 
行 ， 因 而 更 大 地 提高 了 并 发 性 。 
顺序 锁 有 一 个 限制 ， 它 必须 要 求 被 保护 的 共享 资源 不 含有 指针 ， 因 为 写 执行 单元 可 能 使 得 # 
针 失 效 ， 但 读 执行 单元 如 果 正 要 访问 该 指针 ， 将 导致 oops。 

在 Linux 内 核 中 ， 写 执行 单元 涉及 的 顺序 锁 操 作 如 下 。 

1. 获得 顺序 锁 


void write seglock(seqglock t *s1); 
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int write tryseglock(seqglock t *s1); 
write seqlock irqsave(lock, flags) 
write seglock irq(lock) 

write seqlock bh(lock) 





























write seqlock irqsave() = loal irq save() + write seqglock() 
write seglock irq() = local irq disable() + write seqlock() 
write seqlock bh() = local bh disable() + write seqlock() 


2. 释放 顺序 锁 


void write sequnlock(seqlock t *s1); 
write sequnlock irqrestore(lock, flags) 
write sequnlock irq(lock) 

write sequnlock bh (lock) 




















其 i 

x 

write sequnlock irqrestore() = write sequnlock() + local irq restore() 
write sequnlock irq() = write sequnlock() + local irq enable() 

write sequnlock bh() = write sequnlock() + local bh enable() 











写 执行 单元 使 用 顺序 锁 的 模式 如 下 : 
write seqlock(&seqlock a); 
oon) SENERE cu 


write sequnlock(&seqlock a); 

因此 ， 对 写 执行 单元 而 言 ， 它 的 使 用 与 spinlock 相同 。 
读 执行 单元 涉及 的 顺序 锁 操 作 如 下 。 

1. 读 开始 


unsigned read seqbegin(const seglock t *s1); 





















































read segbegin irqsave(lock, flags) 
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读 执 行 单元 在 对 被 顺序 锁 sl 保护 的 共享 资源 进行 访问 前 需要 调用 该 函数 ， 该 函数 仅 返回 顺序 
锁 sl 的 当前 顺序 号 。 其 中 : 

read seqbegin irqsave() = local irq save() + read seqbegin() 

2. 重读 

int read seqretry(const seqglock t *sl, unsigned iv); 

read segretry irqrestore(lock, iv, flags) 


读 执 行 单元 在 访问 完 被 顺序 锁 sl 保护 的 共享 资源 后 需要 调用 该 函数 来 检查 ， 在 读 访问 期 间 是 
否 有 写 操作 。 如 果 有 写 操作 ， 读 执行 单元 就 需要 重新 进行 读 操作 。 则 



















































































































































































read seqretry irqrestore() = read seqretry() + local irq restore() 
读 执行 单元 使 用 顺序 锁 的 模式 如 下 : 
do ( 


Seqnum = read seqbegin(&seqglock a); 


/* 读 操 作 代码 块 */ 
) while (read seqgretry(&seqlock a, seqgnum)); 


7.4.4 ” 读 - 拷 贝 -更 新 


RCU (Read-Copy Update, 读 - 拷 贝 -更 新 ), 它 是 基于 其 原理 命名 的 。 RCU 并 不 是 新 的 锁 机 制 |， 
它 只 是 对 Linux 内 核 而 言 是 新 的 。 早 在 20 世纪 80 年 代 就 有 了 这 种 机 制 ， 而 在 Linux 中 是 在 开发 
内 核 2.5.43 中 引入 该 技术 的 并 正式 包含 在 2.6 内 核 中 。 

对 于 被 RCU 保护 的 共享 数据 结构 ， 读 执行 单元 不 需要 获得 任何 锁 就 可 以 访问 它 ， 不 使 用 原 
子 指令 ， 而 且 在 除 alpha 的 所 有 架构 上 也 不 需要 内 存 屏障 (Memory Barrier)， 因 此 不 会 导致 锁 竞 
争 、 内 存 延 迟 以 及 流水 线 停滞 。 不 需要 锁 也 使 得 使 用 更 容易 ， 因 为 死 锁 问题 就 不 需要 考虑 了 。 使 
用 RCU 的 写 执行 单元 在 访问 它 前 需 首先 拷贝 一 个 副本 ， 然 后 对 副本 进行 修改 ， 最 后 使 用 一 个 回 
调 机 制 在 适当 的 时 机 把 指向 原来 数据 的 指针 重新 指向 新 的 被 修改 的 数据 ， 这 个 时 机 就 是 所 有 引用 
该 数据 的 CPU 都 退出 对 共享 数据 的 操作 的 时 候 。 读 执行 单元 没有 任何 同步 开销 ， 而 写 执行 单元 的 
司 步 开 销 则 取决 于 使 用 的 写 执行 单元 间 同 步 机 制 。 

RCU 可 以 看 作 读 写 锁 的 高 性 能 版 本 ， 相 比 读 写 锁 ，RCU 的 优点 在 于 既 允 许多 个 读 执行 单元 
时 访问 被 保护 的 数据 ， 又 允许 多 个 读 执行 单元 和 多 个 写 执行 单元 同时 访问 被 保护 的 数据 。 但 是 ， 
RCU 不 能 蔡 代 读 写 锁 ， 因 为 如 果 写 比较 多 时 ， 对 读 执行 单元 的 性 能 提高 不 能 弥补 写 执行 单元 导致 
的 损失 。 因 为 使 用 RCU 时 ， 写 执行 单元 之 间 的 同步 开销 会 比较 大 ， 它 需要 延迟 数据 结构 的 释放 ， 
复制 被 修改 的 数据 结构 ， 它 也 必须 使 用 某 种 锁 机 制 同 步 并 行 的 其 他 写 执行 单元 的 修改 操作 。 

Linux 中 提供 的 RCU 操作 包括 如 下 4 种 。 
1. EXE 


rcu read lock() 
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rcu read lock bh() 

2. 读 解锁 

rcu read unlock() 

rcu read unlock bh() 

使 用 RCU 进行 读 的 模式 如 下 : 
rcu read lock() 

.. .A/* 读 临 界 区 */ 

rcu read unlock() 
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其 中 reu. read lock() 和 rcu_read_unlock() 实 质 只 是 禁止 和 使 能 内 核 的 抢占 调度 : 
define rcu read lock() preempt disable() 

define rcu read unlock() preempt enable() 

其 变种 rcu read lock bh(). rcu read unlock bh()Jll]sE 3 73: 

define rcu read lock bh() local bh disable() 

define rcu read unlock bh() local bh enable() 

3. 同步 RCU 


synchronize rcu() 

该 函数 由 RCU 写 执行 单元 调用 ， 它 将 阻塞 写 执行 单元 ， 直 到 所 有 的 读 执行 单元 已 经 完成 读 
执行 单元 临界 区 ， 写 执行 单元 才 可 以 继续 下 一 步 操作 。 如 果 有 多 个 RCU 写 执行 单元 调用 该 函数 ， 
它们 将 在 一 个 grace period〈 即 所 有 的 读 执行 单元 已 经 完成 对 临界 区 的 访问 ) 之 后 全 部 被 唤醒 。 
Synchronize_rcu0) 保 证 所 有 CPU 都 处 理 完 正 在 运行 的 读 执行 单元 临界 区 。 

synchronize kernel() 

内 核 代码 使 用 该 函数 来 等 待 所 有 CPU 处 于 可 抢占 状态 ， 目 前 功能 等 同 于 synchronize rcu(); 
但 现在 已 经 不 建议 使 用 ， 而 是 使 用 synchronize_sched()， 该 函数 用 于 等 待 所 有 CPU 都 处 在 可 抢占 
状态 ， 它 能 保证 正在 运行 的 中 断 处 理 函 数 处 理 完 毕 ， 但 不 能 保证 正在 运行 的 软 中 断 处 理 完 毕 。 

e di 


void call rcu(struct rcu head *head, 















































































































































































































































































































































































































































void (*func) (struct rcu head *rcu)); 
函数 call rcu0 也 由 RCU 写 执行 单元 调用 ， 它 不 会 使 写 执行 单元 阻塞 ， 因 而 可 以 在 中 断 上 下 
文 或 软 中 断 使 用 。 该 函数 将 把 函数 func 挂 接 到 RCU 回调 函数 链 上 ， 然 后 立即 返回 。 函 数 
synchronize_rcu() 的 实现 实际 上 使 用 了 call. rcu ER Zt. 


void call rcu bh(struct rcu head *head, 































































































void (*func) (struct rcu head *rcu)); 

call_rcu_bhO 函 数 的 功能 几乎 与 call_rcu0 完 全 相同 ， 惟 一 差别 就 是 它 把 软 中 断 的 完成 也 当 作 
经 历 一 个 quiescent state〈 静 默 状 态 )， 因 此 如 果 写 执行 单元 使 用 了 该 函数 ， 在 进程 上 下 文 的 读 执 
行 单元 必须 使 用 rcu. read lock bh(). 

每 个 CPU 维护 两 个 数据 结构 rcu. data 和 rcu_bh_data， 它 们 用 于 保存 回调 函数 ， 函 数 call recuo 
把 回调 函数 注册 到 rcu data; Tfj call rcu_bhO 则 把 回调 函数 注册 到 rcu_bh_data， 在 每 一 个 数据 结 
构 上 ， 回 调 函 数 被 组 成 一 个 链表 ， 先 注册 的 排 在 前 头 ， 后 注册 的 排 在 末尾 。 
使 用 RCU 时 ， 读 执行 单元 必须 提供 一 个 信号 给 写 执行 单元 以 便 写 执行 单元 能 够 确定 数据 可 
以 被 安全 地 释放 或 修改 的 时 机 。 有 一 个 专门 的 垃圾 收集 器 来 探测 读 执行 单元 的 信号 ， 一 旦 所 有 的 
读 执行 单元 都 已 经 发 送信 号 告知 它们 都 不 在 使 用 被 RCU 保护 的 数据 结构 ， 垃 圾 收集 器 就 调用 回 
调 函 数 完 成 最 后 的 数据 释放 或 修改 操作 。 

RCU 还 增加 了 链表 操作 函数 的 RCU 版 本 : 

static inline void list add rcu(struct list head *new, struct list head *head); 

该 函数 把 链表 元 素 new 插入 RCU 保护 的 链表 head 的 开头 ， 内 存 栅 保证 了 在 引用 这 个 新 插入 
的 链表 元 素 之 前 ， 新 链表 元 素 的 链接 指针 的 修改 对 所 有 读 执 行 单元 是 可 见 的 。 

static inline void list add tail rcu(struct list head *new, 

struct list head *head); 


该 函数 类 似 于 list add. rcu0， 它 将 把 新 的 链表 元 素 new 添加 到 被 RCU 保护 的 链表 的 末尾 。 


static inline void list del rcu(struct list head *entry); 






















































































n 












































































































































































































































































































































INUX 149 





Linux 设备 驱动 开发 详解 (第 2 版 ) 














该 函数 从 RCU 保护 的 链表 中 删除 指定 的 链表 元 素 entry。 

Static inline void list replace rcu(struct list head *old, struct list head *new); 

该 函数 是 RCU 新 添加 的 函数 ， 并 不 存在 非 RCU 版 本 。 它 使 用 新 的 链表 元 素 new 取代 旧 的 链 
表 元 素 old， 内 存 栅 保 证 在 引用 新 的 链表 元 素 之 前 ， 它 对 链接 指针 的 修正 对 所 有 读 执 行 单元 是 可 
见 的 。 

list for each rcu(pos, head) 

该 宏 用 于 遍历 由 RCU 保护 的 链表 head， 只 要 在 读 执行 单元 临界 区 使 用 该 函数 ， 它 就 可 以 安 
全 地 和 其 他 _rcu 链表 操作 函数 ， 如 list_add_rcu0 并 发 运行 。 

IXst for each safe rcu(pos, n, head) 

该 宏 类 似 于 list for each rcu， 但 不 同 之 处 在 于 它 允 许 安全 地 删除 当前 链表 元 素 pos。 

list for each entry rcu(pos, head, member) 

该 宏 类 似 于 dist for each rcu， 不 同 之 处 在 于 它 用 于 遍历 指定 类 型 的 数据 结构 链 寻 
元 素 pos 为 一 包含 struct list head 结构 的 特定 的 数据 结构 。 

static inline void hlist del rcu(struct hlist node *n) 


已 从 由 RCU 保护 的 哈 希 链表 中 移 走 链表 元 素 n。 


static inline void hlist add head rcu(struct hlist node *n, 
struct hlist head *h); 


该 函数 用 于 把 链表 元 素 n 插入 被 RCU 保护 的 哈 希 链表 的 开头 ， 但 同时 允许 读 执行 单元 对 该 
哈 希 链表 的 遍历 。 内 存 栅 确 保 在 引用 新 链表 元 素 之 前 ， 它 对 指针 的 修改 对 所 有 读 执行 单元 可 见 。 

hlist for each rcu(pos, head) 

该 宏 用 于 遍历 由 RCU 保护 的 哈 希 链表 head， 只 要 在 读 端 临 界 区 使 用 该 函数 ， 它 就 可 以 安全 
地 和 其 他 rcu 哈 希 链 表 操 作 函 数 〈 如 hlist add rcu) 并 发 运行 。 

hlist for each entry rcu(tpos, pos, head, member) 

类 似 于 hlist_ for each rcu0, 不 同 之 处 在 于 它 用 于 过 历 指定 类 型 的 数据 结构 哈 希 链表 ,当前 链 
RIA pos 为 一 包含 struct list head 结构 的 特定 的 数据 结构 。 
目前 ，RCU 的 使 用 在 内 核 中 己 经 非常 普 裔 ， 内 核 中 大 量 原先 使 用 读 写 锁 的 代码 被 RCU 替换 ， 
下 面 的 表单 左右 两 列 平行 地 分 别 给 出 使 用 读 写 锁 和 RCU 实现 链表 元 素 读 、 删 除 、 添 加 和 修改 的 
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， 当 前 链表 
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代码 : 
个 f 
原先 的 audit filter task 函数 ， 读 链表 前 获得 修改 后 的 audit filter task 函数 ， 采 用 RCU 
EE */ D 
Static enum audit state Static enum audit state 
augtr filter taskistruct. task struct dudit rfrlber taskosptruct task struct 
*tsk) *tsk) 
{ { 
struct audit entry *e; struct audit entry *e; 
enum audit state state; enum audit state state; 
read lock(&auditsc lock); rcu read lock(); 
/* 遍历 链表 */ /* 遍历 链表 */ 
list for each entry(e, &audit tsklist, list for each entry rcu(e, 
PESES Wi caudi mt SealsS tt 
if (audit filter rules(tsk, &e if (audit filter rules(tsk, &e 
-»rule, NULL, &state)) ( -»rule, NULL, &state)) ( 
read unlock(&auditsc lock); rcu read unlock(); 
return Stater return state; 
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} } 





















































read unlock(&auditsc lock); rcu read unlock(); 
return AUDIT BUILD CONTEXT; return AUDIT BUILD CONTEXT; 
} } 
/* 原先 的 audit del rule， 删 除 链 表 元 素 前 获得 /* 修改 后 的 audit del rule, 使 用 1ist del rcu 
读 写 锁 */ 删除 链表 元 素 ， 并 调用 call rcu 注册 回调 函数 */ 
Static inline int audit del rule (struct Static inline int audit del rule (struct 
audit rule *rule, struct aucie suis mep See 
list head*list) list head*list) 
{ ( 
struct audit entry *e; struct audit entry *e; 
write lock(&auditsc lock); 
/* 遍历 链表 */ /* 遍历 链表 */ 
list for sach oentry(e, LS Sl list Tor edoh entryie,. list, IXSE) 4 
if (!audit compare rule(rule, &e if (laudit compare rule(rule, &e 
-»rule)) { -2rule)) f 
list del(&e-»1ist); /* 删除 链表 元 素 list del rcu(&e-»list); 
write unlock(&auditsc lock); call rcu(&e-»rcu,audit free rule); 
return 0; return 0; 


} } 
write unlock(&auditsc lock); 
return = EFAULT; réttur "= EBEAUDI; 




















/* 原先 的 audit add rule， 添 加 链表 元 素 前 获得 /* 修改 后 的 audit add rule， 在 添加 链表 元 素 时 
读 写 锁 */ 使 用 1ist add xxx 函数 */ 
static inline int audit add rule(struct static inline int audit add rule(strüoct 
audit entry *entry, struct audit entry *entry, struct 
list head*list) list head*list) 


write lock(&auditsc lock); 


if (entry-»rule.flags &AUDIT PREPEND) { if (entry-»rule.flags &AUDIT PREPEND) { 
entry-»rule.flags &- -AUDIT PREPEND; entry-»rule.flags &- -AUDIT PREPEND; 
list aggdteentrycclist. Jistyv list add rcu(&entry-»list, list); 

) else ( J elge 
irst add tarl(seutry-sl)1st, JI15t)5 list add tail rcu(&entry-»list, 

} list); 


write unlock(&auditsc lock); } 
return 0; return 0; 











/* 原 先 的 audit upd rule 函数 , 在 修改 链表 元 素 前 /* 修改 后 的 auqit upd rule, 使 用 list replace 
获得 读 写 锁 */ 



































static inline int audit upd rule (struct rcu 修改 链表 元 素 , 并 用 call rcu 注册 回调 函数 */ 
audit rule *rule, struct list head Static inline int audit upd rule (struct 
eter le gesta 132 audit rule *rule, struct list head 
newfield count) SEE 


{ newfield count) 
struct audit entry *e; { 
struct audit newentry *ne; struct audit entry *e; 
write lock(&auditsc lock); struct audit newentry *ne; 


/* 遍历 链表 */ 
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lier tor each emteyle, list, list) 1 /* 遍历 链表 */ 
list Tor saot edtryie, irst haise 


if (laudit compare rule(rule, &e 
if (l!audit compare rule(rule, &e 


-»2rule)) 1 


e-»rule.action = newaction; -»rule)) í( 
ne = kmalloc(sizeof(*entry), 


newfield count; GFP ATOMIC) ; /* 分 配 新 元 素 内 存 */ 
write unlock(&auditsc lock); if (ne == NULL) 

return = ENOMEM; 
audit copy rule(&ne-»rule, &e 

-»rule);/* 写 前 拷贝 */ 
ne-»rule.action = newaction; 


e-»rule.file count - 


ne-»rule.file count - 
newfield count; 

list replace rcu(e, ne); 

call rcu(&e-»rcu,audit free rule); 


return 0; 


return 0; } 


write unlock(&auditsc lock); 
return = EFAULT; return 


7.5 ER 


7.5.4 信号 量 的 使 用 


信号 量 (semaphore) 是 用 于 保护 临界 区 的 一 种 常用 方法 ， 它 的 使 用 方式 和 自 旋 锁 类 似 。 与 
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旋 锁 相同 ， 只 有 得 到 信和 号 量 的 进程 才能 执行 临界 区 代码 。 但 是 ， 与 自 旋 锁 不 同 的 是 ， 当 获取 不 到 


信号 量 时 ， 进 程 不 会 原 地 打转 而 是 进入 休眠 等 待 状态 。 
Linux 中 与 信号 量 相 关 的 操作 主要 有 : 
1. 定义 信号 量 
下 列 代 码 定义 名 称 为 sem 的 信和 号 
Struct semaphore sem; 
2. 初始 化 信号 量 
void sema init(struct semaphore *sem, int val); 


该 函数 初始 化 信号 量 ， 并 设置 信号 量 sem 的 值 为 val。 尽 管 信号 量 可 以 被 初始 化 为 大 于 1 的 
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值 从 而 成 为 一 个 计数 信号 量 ， 但 是 它 通常 不 被 这 样 使 用 。 




























































































define init MUTEX(sem) sema init(sem, 1) 

该 宏 用 于 初始 化 一 个 用 于 互 斥 的 信号 量 ， 它 把 信号 量 sem 的 值 设置 为 1; 
define init MUTEX LOCKED(sem) sema init(sem, 0) 

该 安 也 用 于 初始 化 一 个 信号 量 ， 但 它 把 信号 量 sem 的 值 设置 为 0; 

此 外 ， 下 面 两 个 宏 是 定义 并 初始 化 信号 量 的 “快捷 方式 ”: 


DECLARE MUTEX (name) 
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DECLARE MUTEX LOCKED (name) 

前 者 定义 一 个 名 为 name 的 信号 量 并 初始 化 为 1; 后 者 定义 一 个 名 为 name 的 信号 量 并 初始 化 
为 0。 

3. 获得 信号 量 

void down(struct semaphore * sem); 

该 函数 用 于 获得 信号 量 sem， 它 会 导致 睡眠 ， 因 此 不 能 在 中 断 上 下 文 使 用 ; 

int down interruptible(struct semaphore * sem); 

该 函数 功能 与 down 类 似 , 不 同 之 处 为 ,因为 down() 而 进入 睡眠 状态 的 进程 不 能 被 信号 打 断 ， 
但 因为 down_interruptible(O) 而 进入 睡眠 状态 的 进程 能 被 信号 打 断 ， 信 号 也 会 导致 该 函数 返回 ， 这 
时 候 函 数 的 返回 值 非 0; 


int down trylock(struct semaphore * sem); 
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该 函数 尝试 获得 信号 量 sem， 如 果 能 够 立刻 获得 ， 它 就 获得 该 信号 量 并 返回 0， 否 则 ， 返 回 
非 0 值 。 它 不 会 导致 调 用 者 睡眠 ， 可 以 在 中 断 上 下 文 使 用 。 
在 使 用 down_interruptible() 获 取信 号 量 时 ， 对 返回 值 一 般 会 进行 检查 ， 如 果 非 0， 通常 立即 返 
-ERESTARTSYS, 4: 


if (down interruptible(&sem)) 
return -— ERESTARTSYS; 

4. 释放 信号 量 

void up(struct semaphore * sem); 

该 函数 释放 信号 量 sm， 唤 醒 等 待 者 。 

信号 量 一 般 这 样 被 使 用 : 

/* 定义 信号 量 

DECLARE MUTEX (mount sem); 

down(&mount sem);/* 获取 信号 量 ， 保 护 临 界 区 
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critical section /* 临界 区 


px 


up(&mount sem); /* 释放 信号 量 





Linux 自 旋 锁 和 信号 量 所 采用 的 “获取 锁 一 访问 临界 区 一 释放 锁 ” 的 方式 ,姑且 称 之 为 " 互 斥 
三 部 曲 ”, 实际 存在 于 几乎 所 有 的 多 任务 操作 系统 之 中 ， 在 WIN32、VxWorks 等 中 皆 如 此 。 
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代码 清单 7.3 给 出 了 使 用 信号 量 实现 设备 只 能 被 一 个 进程 打开 的 例子 ， 等 同 于 代码 清单 7.1 






































代码 清单 7.3 ”使 用 信号 量 实现 设备 只 能 被 一 个 进程 打开 


static DECLARE MUTEX (xxx lock);/* 定义 互 斥 锁 


static int xxx open(struct inode *inode, struct file *filp) 
i 


if (down trylock(&xxx lock))  /* 获得 打开 锁 
return - EBUSY; /* 设备 忙 





O 0 -1 o) OU! 4 €) BO BS 


return Op /* HI */ 








Linux 设备 驱动 开发 详解 (第 2 版 ) 





static int xxx release(struct inode *inode, struct file *filp) 


up(&xxx lock);  /* 释放 打开 锁 


return 0; 
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7.5.2 ”信号 量 用 于 同步 

如 果 信 号 量 被 初始 化 为 0， 则 它 可 以 用 于 同步 ， 同 步 意 味 着 一 个 执行 单元 的 继续 执行 需 等 待 
另 一 执行 单元 完成 某 事 ， 保 证 执行 的 先后 顺序 。 如 图 7.4 所 示 ， 执 行 单元 A 执行 代码 区 域 b 之 前 ， 
必须 等 待 执行 单元 B 执行 完 代 码 单元 c， 信 和 号 量 可 辅助 这 一 同步 过 程 。 























































































































执行 单元 A 执行 单元 B 
struct semaphore sem; 
init MUTEX LOCKED (&sem) ; 














代码 区 域 a 
down(&sem); B 
代码 区 域 b se 代码 区 域 c 


— up(&sem); 
74 信号 量 用 于 同步 
7.5.8 ”完成 量 用 于 同步 


Linux 提供 了 一 种 比 7.5.2 所 述 更 好 的 同步 机 制 ， 即 完成 量 (completion， 关 于 这 个 名 词 ， 至 
及 有 好 的 翻译 ， 笔 者 将 其 译 为 “完成 量 ”， 它 用 于 一 个 执行 单元 等 待 另 一 个 执行 单元 执行 完 
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Linux H 5 completion 相关 的 操作 主要 有 以 下 4 种 
1. 定义 完成 量 
下 列 代码 定义 名 为 my_completion 的 完成 量 : 
struct completion my completion; 
2. 初始 化 completion 
下 列 代码 初始 化 my completion 这 个 完成 量 : 
init completion(&my completion); 
对 my. completion 的 定义 和 初始 化 可 以 通过 如 下 快捷 方式 实现 : 
DECLARE COMPLETION (my completion); 
3. 等 待 完成 量 
下 列 函 数 用 于 等 待 一 个 completion 被 唤醒 ， 
void wait for completion(struct completion *c); 
4. 唤醒 完成 量 
下 面 两 个 函数 用 于 唤醒 完成 量 : 


void complete(struct completion *c); 
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void complete all(struct completion *c); 
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前 者 只 唤醒 一 个 等 待 的 执行 单元 ， 后 者 释放 所 有 等 待 同一 完成 量 的 执行 单元 。 
7.5 描述 了 使 用 完成 量 实现 的 与 图 7.4 对 应 的 信号 量 实现 的 同步 功能 。 
































执行 单元 A 执行 单元 B 
struct complete com; 
init completion (&com); 


代码 区 域 a 


wait for completion(&com), 


PD E — Hg 代码 区 域 。 


complete(&com); 


7.5 “完成 量 用 于 同步 


7.5.4 BEES vs 信号 量 
自 旋 锁 和 信和 号 量 都 是 解决 互 斥 问题 的 基本 手段 ， 面 对 特定 的 情况 ， 应 该 如 何 取 售 这 两 种 手段 
呢 ? 选择 的 依据 是 临界 区 的 性 质 和 系统 的 特点 。 
从 严格 意义 上 说 ， 信 和 号 量 和 自 旋 锁 属 于 不 同 层 次 的 互 斥 手段 ， 前 者 的 实现 有 赖 于 后 者 。 在 信 
本 身 的 实现 上 ， 为 了 保证 信号 量 结构 存 取 的 原子 性 ， 在 多 CPU 中 需要 自 旋 锁 来 互 斥 。 
信号 量 是 进程 级 的 ， 用 于 多 个 进程 之 间 对 资源 的 互 斥 ， 虽 然 也 是 在 内 核 中 ， 但 是 该 内 核 执行 
路 径 是 以 进程 的 身份 ， 代 表 进 程 来 争夺 资源 的 。 如 果 竞 争 失败 ， 会 发 生 进 程 上 下 文 切 换 ， 当 前 进 
程 进入 睡眠 状态 ，CPU 将 运行 其 他 进程 。 鉴 于 进程 上 下 文 切换 的 开销 也 很 大 ， 因 此 ， 只 有 当 进 程 
占用 资源 时 间 较 长 时 ， 用 信号 量 才 是 较 好 的 选择 。 
当 所 要 保护 的 临界 区 访问 时 间 比 较 短 时 ， 用 自 旋 锁 是 非常 方便 的 ， 因 为 它 节省 上 下 文 切 换 的 
时 间 。 但 是 CPU 得 不 到 自 旋 锁 会 在 那里 空转 直到 其 他 执行 单元 解锁 为 止 ， 所 以 要 求 锁 不 能 在 临界 
区 里 长 时 间 停 留 ， 否 则 会 降低 系统 的 效率 。 
由 此 ， 可 以 总 结 旋 锁 和 信号 量 选 用 的 3 项 原则 。 

da) 当 锁 不 能 被 获取 到 时 ， 使 用 信号 量 的 开销 是 进程 上 下 文 切换 时 间 Ts,， 使 用 自 旋 锁 的 开 
销 是 等 待 获取 自 旋 锁 〈 由 临界 区 执行 时 间 决 定 ) Teo Æ To 比较 小 ， 宜 使 用 自 旋 锁 ， 若 Te。 很 大 ， 
应 使 用 信和 号 量 。 

(2) 信号 量 所 保护 的 临界 区 可 包含 可 能 引起 阻塞 的 代码 ， 而 自 旋 锁 则 绝对 要 避免 用 来 保护 包 
含 这 样 代码 的 临界 区 。 因 为 阻塞 意味 着 要 进行 进程 的 切换 ， 如 果 进 程 被 切换 出 去 后 ， 另 一 个 进程 
企图 获取 本 自 旋 锁 ， 死 锁 就 会 发 生 。 

(3) 信号 量 存在 于 进程 上 下 文 ， 因 此 ， 如 果 被 保护 的 共享 资源 需要 在 中 断 或 软 中 断 情况 下 使 
用 ， 则 在 信号 量 和 自 旋 锁 之 间 只 能 选择 自 旋 锁 。 当 然 ， 如 果 一 定 要 使 用 信号 量 ， 则 只 能 通过 
down trylock(0) 方 式 进行 ， 不 能 获取 就 立即 返回 以 避免 阻塞 。 
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7.5.5 ” 读 写 信号 量 

读 写 信号 量 与 信号 量 的 关系 与 读 写 自 旋 锁 和 自 旋 锁 的 关系 类 似 ， 读 写 信 号 量 可 能 引起 进程 阻 
塞 ,， 但 它 可 允许 NN 个 读 执 行 单元 同时 访问 共享 资源 ， 而 最 多 只 能 有 1 个 写 执行 单元 。 因 此 ， 读 写 
信号 量 是 一 种 相对 放宽 条 件 的 粒度 稍 大 于 信号 量 的 互 斥 机 制 。 
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前 者 引起 的 睡眠 不 能 被 信号 打 断 ， 而 后 者 可 以 。mnutex_trylock0O 用 于 尝试 获得 mutex， 获 取 不 到 























读 写 自 旋 锁 涉 及 的 操作 包括 如 下 5 种 
1. 定义 和 初始 化 读 写 信号 量 


struct rw semaphore my rws; /* 定 义 读 写 信号 量 */ 














o 





void init rwsem(struct rw semaphore *sem); /* 初 始 化 读 写 信号 量 */ 
2. 读 信 号 量 获取 

void down read(struct rw semaphore *sem); 

int down read trylock(struct rw semaphore *sem); 

3. ife s S REX 

void up read(struct rw semaphore *sem); 

4. 写 信号 量 获取 

void down write(struct rw semaphore *sem); 

int down write trylock(struct rw semaphore *sem); 


5. 写 信 号 量 释放 

void up write(struct rw semaphore *sem); 
读 写 信号 量 一 般 这 样 被 使 用 : 
rw semaphore rw sem;  /* 定义 读 写 信号 量 */ 
init rwsem(&rw sem); /* 初始 化 读 写 信号 量 */ 






































/* 读 时 获取 信号 量 */ 
down read(&rw sem); 
/* 临界 资源 */ 


up read(&rw sem); 





/* 写 时 获取 信号 量 */ 
down write(&rw sem); 
/* 临界 资源 */ 


up write(&rw sem); 


4.6 ELI 















































尽管 信号 量 已 经 可 以 实现 互 斥 的 功能 ， 而 且 包 含 DECLARE_ MUTEXQ. init MUTEX 0 等 定 
号 量 的 宏 或 函数 ， 从 名 字 上 看 就 体现 出 了 互 斥 体 的 概念 ， 但 是 “正宗 ”的 mutex 在 Linux 内 
还 是 真实 地 存在 着 。 

下 面 代 码 定义 名 为 my_mnutex 的 互 斥 体 并 初始 化 它 : 








struct mutex my mutex; 
mutex init(&my mutex); 


面 的 两 个 函数 用 于 获取 互 斥 体 : 


void inline . sched mutex lock(struct mutex *lock); 






































int | sched mutex lock interruptible (struct mutex *lock); 
int | sched mutex trylock(struct mutex *lock); 


mutex lock()5j mutex lock interruptible()H [X J| fl down()5i down trylockO 的 区 别 完 全 一 致 ， 


















































mutex 时 不 会 引起 进程 睡眠 。 



































下 列 函 数 用 于 释放 互 斥 体 : 


void | sched mutex unlock(struct mutex *lock); 
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mutex 的 使 用 方法 和 信和 号 量 用 于 互 斥 的 场合 完全 一 样 : 
struct mutex my mutex; /* 定义 mutex */ 
mutex init(&my mutex); /* 初始 化 mutex */ 





mutex lock(&my mutex); /* 获取 mutex */ 
. 8 临界 资源 */ 
mutex unlock(&my mutex); /* 释放 mutex */ 


MEE 增加 并 发 控制 后 的 globalmem 驱动 


在 globalmemO 的 读 写 函数 中 ， 由 于 要 调用 copy from user()、copy_to_user() 这 些 可 能 导致 阻 
塞 的 函数 ， 因 此 不 能 使 用 自 旋 锁 ， 宜 使 用 信号 量 。 
驱动 工程 师 习 惯 将 某 设备 所 使 用 的 自 旋 锁 、 信 和 号 量 等 辅助 手段 也 放 在 设备 结构 中 ， 因 此 ， 本 
如 代码 清单 7.4 那样 修改 globalmem dev 结构 体 的 定义 ， 并 在 模块 初始 化 函数 中 初始 化 这 个 信和 号 
量 ， 如 代码 清单 7.5 所 示 。 


代码 清单 7.4 增加 并 发 控制 后 的 globalmem 设备 结构 体 


1 struct globalmem dev { 















































































































































































































































2 struct cdev cdev; /*cdev 结构 体 */ 

3 unsigned char mem[GLOBALMEM SIZE]; /* 全 局 内 存 */ 
4 struct semaphore sem; /* 并 发 控制 用 的 信号 量 */ 
5H 


代码 清单 7.5 ”增加 并 发 控制 后 的 globalmem 设备 驱动 模块 加 载 函 数 













































































1 int globalmem init (void) 

2 4 

E int result; 

4 dev t devno = MKDEV (globalmem major, 0); 

5 

6 /* 申请 设备 号 */ 

y if (globalmem major) 

8 result = register chrdev region(devno, 1, "globalmem"); 
9 else ( /* 动态 申请 设备 号 */ 

0 result = alloc chrdev region(&devno, 0, 1, "globalmem"); 
E globalmem major = MAJOR (devno); 

2 } 

3 if Xxesult € 09 

4 return result; 

» 

6 /* 动态 申请 设备 结构 体 的 内 存 */ 

7 globalmem devp = kmalloc(sizeof(struct globalmem dev), GFP KERNEL); 
8 if (!globalmem devp) ( /* 申 请 失败 */ 

9 result = - ENOMEM; 

20 Noto fdlbomalloc: 

ul ) 

22 memset(globalmem devp, 0, sizeof(struct globalmem dev)); 

DR 

24 globalmem setup cdev(globalmem devp, 0); 

25 init MUTEX(&globalmem devp-»sem);  /* 初 始 化 信号 量 */ 
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26 return 0; 


Zh fail malloc: unregister chrdev region(devno, 1); 
29 return result; 
Som) 


在 访问 globalmem dev 中 的 共享 资源 时 ， 需 先 获 取 这 个 信号 量 ， 访 问 完 成 后 ， 随 即 释放 这 个 
信号 量 。 驱 动 中 新 的 globalmem 读 、 写 操作 如 代码 清单 7.6 所 示 。 


代码 清单 7.6 ”增加 并 发 控制 后 的 globalmem 读 写 操作 





































































































1 /* 增 加 并 发 控制 后 的 globalmem 读 函 数 */ 
2 static ssize t globalmem read(struct file *filp, char a user *buf, size t size, 
3 loff t *ppos) 
a oq 
5 unsigned long p = *ppos; 
6 unsigned int count - size; 
7 int ret = 0; 
8 struct globalmem dev *dev = filp-»private data; /* 获 得 设备 结构 体 指 针 */ 
9 
0 /* 分 析 和 获取 有 效 的 写 长 度 */ 
if (p >= GLOBALMEM SIZE) 
2 return 0; 
3 if (count » GLOBALMEM SIZE - p) 
4 count = GLOBALMEM SIZE = p; 
5) 
16 if (down interruptible(&dev-»sem)) /* 获得 信号 量 */ 
3! return —OHRHSTIARTSYS; 
8 
9 /* 内 核 空 间 一 用 户 空间 */ 
20 if (copy to user(buf, (void*) (dev-»mem * p), count)) ( 
il ret = - EFAULT; 
22 ) else ( 
23 *ppos t- count; 
24 ret = count; 
215 
26 printk(KERN INFO "read $d bytes(s) from $dWMn", count, p); 
2 ) 
28 up(&dev-»sem); /* 释放 信号 量 */ 
29 
30 return ret; 
Sub 
22 


33 /* 增 加 并 发 控制 后 的 globalmem 写 函 数 */ 


34 static ssize t globalmem write(struct file *filp, const char user *buf, 





35 sizot sizo, dieses ie APOS) 

GNE 

37! unsigned long p = *ppos; 

38 unsigned int count - size; 

39 int ret = 0; 

40 struct globalmem dev *dev = filp-»private data; /* 获 得 设备 结构 体 指针 */ 
41 

42 /* 分 析 和 获取 有 效 的 写 长 度 */ 

43 if (p >= GLOBALMEM SIZE) 

44 return 0; 
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45 if (count » GLOBALMEM SIZE - p) 


eo06 




















46 count = GLOBALMEM SIZE = p; 

47 

48 if (down interruptible(&dev-»sem)) /* 获得 信号 量 */ 
49 return = ERESTARTSYS; 

50 

51 /* 用 户 空间 一 内 核 空 间 */ 

52 if (copy from user(dev-»mem + p, buf, count)) 

53 ret = = EFAULT; 

54 else { 

55 *ppos += count; 

56 ret = count; 

57 

5x9 printk(KERN INFO "written $d bytes(s) from $dMn", count, p); 
9 } 

60 up(&dev-»sem); /* 释放 信号 量 */ 

61 return ret; 

62 l 




















尺码 第 16—17 行 和 第 49—50 行 用 于 获取 信号 量 ， 如 果 down interruptible()3& EEE 0, D] x 
味 着 其 在 获得 信号 量 之 前 已 被 打 断 ， 这 时 写 函 数 返回 -ERESTARTSYS。 代码 第 28 和 60 行 用 于 在 
对 临界 资源 访问 结束 后 释放 信号 量 。 
除了 globalmem 的 读 写 操作 之 外 ， 如 果 在 读 写 的 同时 ， 另 一 执行 单元 执行 MEM CLEAR IO 
控制 命令 ， 也 会 导致 全 局 内 存 的 混乱 ， 因 此 ，globalmem ioctl(0) 函 数 也 需 被 重 写 ， 如 代码 清单 7.7 
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所 示 。 
代码 清单 7.7 增加 并 发 控制 后 的 globalmem 设备 驱动 ioctl() 函 数 
1 static int globalmem ioctl(struct inode *inodep, struct file *filp, unsigned 
2 int cmd, unsigned long arg) 
SRi 
4 struct globalmem dev *dev = filp->private data; /* 获 得 设备 结构 体 指针 */ 
5 
6 Bwitch (cmd) 4 
Ji case MEM CLEAR: 
8 if (down interruptible(&dev-»sem)) /* 获 得 信号 量 */ 
9 return = ERESTARTSYS? 
0 
Hi memset (dev->mem, 0, GLOBALMEM SIZE); 
12 up(&dev-»sem); /* 释 放 信 号 量 */ 
3 
4 printk(KERN INFO "globalmem is set to zeroNn"); 
9 break; 
6 
Ji default: 
8 return - EINVAL; 
SF jy 
20 return 0; 
2 








增加 并 发 控制 后 globalmem 的 完整 驱动 位 于 虚拟 机 的 /home/lihacker/develop/svn/ldd6410- 
read-only/training/kernel/drivers/globalmem/ch7 目录 ， 其 使 用 方法 与 6.4 Ti globalmem 驱动 在 用 户 
空间 的 验证 一 致 。 
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1.86 EC 














并 发 和 竞 态 ) 泛 存 在 ， r Wr) Im 原子 操作 、 Š 
断 屏蔽 很 少 单独 被 使 用 ， 原 子 操作 只 能 针对 整数 进 
自 旋 锁 会 导致 死 循 环 ， 锁 定期 间 不 允许 阻塞 ， 因 































































































阻塞 ， 可 以 适用 于 临界 区 大 的 情况 。 
读 写 自 旋 锁 和 读 写 信号 量 分 别 
























































条 件 的 自 
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锁 和 信号 量 都 是 解决 并 发 问题 的 机 制 。 
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因此 自 旋 锁 和 信号 
此 要 求 锁 定 的 临界 区 小 。 
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锁 和 信和 号 


t, CNR 


量 应 用 最 为 广泛 。 











洁 号 量 允 许 临界 区 
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一 
本 章 导读 5 
阻塞 和 非 阻 塞 1/O 是 设备 访问 的 两 种 不 同 模式 ， 驱 动 程序 可 以 灵活 地 S 

支持 用 户 空间 对 设备 的 这 两 种 访问 方式 。 ZU 
8.1 节 讲述 了 阻塞 和 非 阻 塞 IO 的 区 别 , 并 讲解 了 实现 阻塞 IO 的 等 待 xn 

队列 机 制 ， 以 及 在 globalfifo 设备 驱动 中 增加 对 阻塞 VO 支持 的 方法 ， 并 本 

进行 了 用 户 空间 的 验证 。 [eel 
82 节 讲述 了 设备 驱动 的 轮 询 (poll) 操作 的 概念 和 编程 方法 ，poll 可 过 

以 帮助 用 户 了 解 是 否 能 对 设备 进行 无 阻塞 的 访问 。 B 
8.3 节 讲 解 在 globalfifo 中 增加 poll 操作 的 方法 , 并 进行 了 用 户 空间 的 

验证 。 c3 

TA 
Hn 
Hid 
AT 
Au 
Hn 
Hid 
=a 
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8.1 FH 3€ E: JEPH I/O 


阻塞 操作 是 指 在 执行 设备 操作 时 ， 若 不 能 获得 资源 ， 则 挂 起 进程 直到 满足 可 操作 的 条 件 后 再 
进行 操作 。 被 挂 起 的 进程 进入 休眠 状态 ， 被 从 调度 器 的 运行 队列 移 走 ， 直 到 等 待 的 条 件 被 满足 。 
而 非 阻 塞 操作 的 进程 在 不 能 进行 设备 操作 时 ， 并 不 挂 起 ， 它 或 者 放弃 ， 或 者 不 停 地 查询 ， 直 至 可 
以 进行 操作 为 止 。 

驱动 程序 通常 需要 提供 这 样 的 能 力 : 当 应 用 程序 进行 read()、write(0) 等 系统 调用 时 ， 若 设备 的 
资源 不 能 获取 ， 而 用 户 又 希望 以 阻塞 的 方式 访问 设备 ， 驱 动 程序 应 在 设备 驱动 的 xxx_read()、 
xxx_write0 等 操作 中 将 进程 阻塞 直到 资源 可 以 获取 ， 此 后 ， 应 用 程序 的 read()、write0 等 调用 才 返 
可 ， 整 个 过 程 仍然 进行 了 正确 的 设备 访问 ， 用 户 并 没有 感知 到 ;， 若 用 户 以 非 阻塞 的 方式 访问 设备 
文件 ， 则 当 设 备 资源 不 可 获取 时 ， 设 备 驱动 的 xxx_read()、xxx_write() 等 操作 应 立即 返回 ，read()、 
write() 等 系统 调用 也 随即 被 返回 。 

阻塞 从 字面 上 上 听 起 来 似乎 意味 着 低 效率 ， 实 则 不 然 ， 如 果 设 备 驱动 不 阻塞 ， 则 用 户 想 获取 设 
备 资源 只 能 不 停 地 查询 ， 这 反而 会 无 谓 地 耗费 CPU 资源 。 而 阻塞 访问 时 ， 不 能 获取 资源 的 进程 将 
进入 休眠 ， 它 将 CPU 资源 “礼让 ”给 其 他 进程 。 
因为 阻塞 的 进程 会 进入 休眠 状态 ， 因 此 ， 必 须 确保 有 一 个 地 方 
进程 就 真 的 “寿终正寝 ”了 。 唤 醒 进 程 的 地 方 最 大 可 能 发 生 在 中 断 
时 往往 伴随 着 一 个 中 断 。 
代码 清单 8.1 和 8.2 分 别 演示 了 以 阻塞 和 非 阻 塞 方式 读 取 串 口 一 个 字符 的 代码 。 实 际 的 串口 
编程 中 ， 若 使 用 非 阻 塞 模式 ， 还 可 借助 信号 (sigaction) 以 异步 方式 访问 串口 以 提高 CPU 利用 率 ， 
而 这 里 仅仅 是 为 了 说 明 阻 塞 与 非 阻 塞 的 区 别 。 


代码 清单 8.1 阻塞 地 读 串 口 一 个 字符 
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够 唤醒 休眠 的 进程 ， 和 否则， 
， 因 为 硬件 资源 获得 的 同 
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char m 
fd - open("/dev/ttyS1", O RDWR); 





























res = read(fd,&buf,1); /* 当 串 口上 有 输入 时 才 返 回 */ 
if(res--1) 
primer ccm ME 

代码 清单 8.2” 非 阻塞 地 读 串 口 一 个 字符 
Gamo 
fd = open("/dev/ttyS1", O RDWR| O NONBLOCK); 


while (read (fd, &buf,1)!=1) 


continue; /* 串口 上 无 输入 也 返回 ， 所 以 要 循环 尝试 读 取 串 口 */ 
joucabsntag (Uere aW, JoxBHE d e 


8.1.1 等 待 队列 


在 Linux 驱动 程序 中 ， 可 以 使 用 等 待 队列 (wait queue) 来 实现 阻塞 进程 的 唤醒 。wait queue 
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很 早 就 作为 一 个 基本 的 功能 单位 出 现在 Linux. 内 核 里 了 ， 它 以 队列 为 基础 数据 结构 ， 与 进程 调度 
机 制 紧密 结合 ， 能 够 用 于 实现 内 核 中 的 异步 事件 通知 机 制 。 等 待 队列 可 以 用 来 同步 对 系统 资源 的 
访问 ， 第 7 章 中 所 讲述 的 信号 量 在 内 核 中 也 依赖 等 待 队 列 来 实现 。 

Linux 2.6 提供 如 下 关于 等 待 队列 的 操作 。 

1. 定义 “等 待 队列 头 ” 

wait queue head t my queue; 

2. 初始 化 “等 待 队列 头 ” 

init waitqueue head(&my queue); 

而 下 面 的 DECLARE WAIT QUEUE HEAD0 宏 可 以 作为 定义 并 初始 化 等 待 队列 头 的 “快捷 
DECLARE WAIT QUEUE HEAD (name) 
3. 定义 等 待 队列 
DECLARE WAITQUEUE (name, tsk) 
该 宏 用 于 定义 并 初始 化 一 个 名 为 name 的 等 待 队 列 。 
4. 添加 / 移 除 等 待 队列 


void fastcall add wait queue(wait queue head t *q, wait queue t *wait); 
void fastcall remove wait queue(wait queue head t *q, wait queue t *wait); 


add wait queue(O 用 于 将 等 待 队列 wait 添加 到 等 待 队列 头 q 指向 的 等 待 队列 链表 中 ， 而 
remove wait queue() 用 于 将 等 待 队 列 wait 从 附属 的 等 待 队 列 头 q 指向 的 等 待 队列 链表 中 移 除 。 
5. 等 待 事件 


wait event (queue, condition) 
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wait event interruptible(queue, condition) 
wait event timeout(queue, condition, timeout) 
wait event interruptible timeout(queue, condition, timeout) 


等 待 第 1 个 参数 queue 作为 等 待 队列 头 的 等 待 队列 被 唤醒 ， 而 且 第 2 个 参数 condition 必须 满 
足 ， 和 否则 继续 阻塞 。wait event() 和 wait event interruptibleO 的 区 别 在 于 后 者 可 以 被 信号 打 断 ， 而 
前 者 不 能 。 加 上 _timeout 后 的 宏 意 味 着 阻塞 等 待 的 超时 时 间 ， 以 jiffy 为 单位 , 在 第 3 个 参数 的 timeout 
到 达 时 ， 不 论 condition 是 否 满 足 ， 均 返回 。 
wait() 的 定义 如 代码 清单 8.3 所 示 ， 从 其 源 代 码 可 以 看 出 ， 当 condition 满足 时 ，wait event() 


会 立即 返回 ， 和 否则 ， 阻 塞 等 待 condition 满足 。 































































































代码 清单 8.3 wait _event() 函 数 














1 #define wait event(wg, condition) N 

2 Ce i N 

3 if (condition) /* 条 件 满足 立即 返回 */ \ 

4 break; N 

E . wait event (wq，condition);/* 添 加 等 待 队 列 并 阻塞 */ 
6 } while (0) 

7 

8 #define wait event(wg, condition) N 

9 do 4 N 

10 DEFINE WAIT( wait); N 

11 N 

12 for (;;) ( N 

13 prepare to wait(&wq, & wait, TASK UNINTERRUPTIBLE); N 
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14 if (condition) y 
15 break; \ 
16 schedule () ;/* 放 弃 CPU*/ N 
A7 } N 
18 finish wait(&wq, & wait); N 


19 ) while (0) 
































20 

2L sul 

22 prepare to wait(wait queue head t *q, wait queue t *wait, int state) 
23 1 

24 unsigned long flags; 

25 

26 wait-»flags &- -WQ FLAG EXCLUSIVE; 

27 spin lock irgsave(t&g-^lock, flags); 

28 if (list empty(&wait-»task list)) 

29 . add wait queue(q, wait); /* 加 入 等 待 队 列 */ 
30 set current state(state); /* W EJUS */ 

SL spin unlock irqrestore(&q-»1lock, flags); 

32i) 

33 

34 void finish wait(wait queue head t *q, wait queue t *wait) 
SEE 

36 unsigned long flags; 

aq 

38 . Set current state (TASK RUNNING); /* 恢复 进程 状态 为 TASK RUNNING */ 
39 

40 if (!list empty careful(&wait-»task list)) í( 

41 Bpin look irgsave(sqg-»lock, flags); 

42 list del init(&wait-»2task list); 

43 spin unlock irqrestore(&q-»5lock, flags); 

44 ) 

45 ] 

6. 唤醒 队列 


void wake up(wait queue head t *queue); 





void wake up interruptible (wait queue head t *queue); 
























































列 对 应 的 进程 。 





上 述 操作 会 唤醒 以 queue 作为 等 待 队列 头 的 所 有 等 待 队列 中 所 有 属于 该 


等 待 队 列 头 的 等 待 队 


wake_up() 应 该 与 wait_event() 或 wait event timeout0 成 对 使 用 ， 而 wake up interruptible() 


则 应 与 wait event interruptible0) 或 wait_event_interruptible_timeoutO 成 对 使 



































]. wake upO 可 唤醒 





处 于 TASK _INTERRUPTIBLE fil TASK UNINTERRUPTIBLE 的 进程 ， 而 wake up interruptible() 























只 能 唤醒 处 于 TASK INTERRUPTIBLE 的 进程 。 
7. 在 等 待 队 列 上 睡眠 


Sleep on(wait queue head t *q ); 





interruptible sleep on(wait queue head t *q ); 



































sleep_on0 函 数 的 作用 就 是 将 目前 进程 的 状态 置 成 TASK_UNINTERRUPTIBLE， 并 定义 一 


























等 待 队列 ， 之 后 把 它 附 属 到 等 待 队列 头 q， 直 到 资源 可 获得 ，d 引导 的 等 待 队列 被 唤醒 。 
























































interruptible sleep on() Ej sleep on0 函 数 类 似 ， 其 作用 是 将 目前 进程 
INTERRUPTIBLE， 并 定义 一 个 等 竺 队列， 之 后 把 它 附属 到 等 待 队列 头 q， 直 至 
等 待 队列 被 唤醒 或 者 进程 收 到 信和 号 。 







































































的 状态 置 成 TASK 
到 资源 可 获得 ，q 引导 
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sleep_on0 函 数 应 该 与 wake_up0 成 对 使 用 ，interruptible _ sleep_on0) 应 该 与 wake up interruptible() 
成 对 使 用 。 
代码 清单 8.4 和 8.5 分 别 列 出 了 sleep on0 和 interruptible sleep _on0 函 数 的 源 代 码 。 























代码 清单 8.4 sleep_on() 函 数 




















1 void sched sleep on(wait queue head t *q) 
EET 
3) Sleep on common(q, TASK UNINTERRUPTIBLE, MAX SCHEDULE TIMEOUT); 
A 
5 
6 static long J sched 
7 sleep on common (wait queue head t *q, int state, long timeout) 
$9 T 
9 unsigned long flags; 
0 wait queue t wait; 
1l 
5 init waitqueue entry(&wait, current); 
S 
4 — set current state(state); 
5 
6 spin lock irqsave(&q-»lock, flags); 
7) . add wait queue(q, &wait); /* 加 入 等 待 队列 */ 
8 spin nnlock(&q-slockys 
9 timeout = schedule timeout(timeout); /* 进程 切换 */ 
20 spin Dok noe OCRE 
21 _ remove wait queue(q, &wait); /* 移 除 等 待 队列 */ 
22 spin unlock irqrestore(&q->lock, flags); 
253 
24 return timeout; 
252) 


代码 清单 8.5  interruptible sleep on()ER Zt 
1 void sched interruptible sleep on(wait queue head t *q) 
PEE 
3 Sleep on _ common (q, TASK INTERRUPTIBLE, MAX SCHEDULE TIMEOUT) ; 
a gy 


从 代码 清单 8.4 和 8.5 可 以 看 出 ， 不 论 是 sleep_on0 还 是 interruptible sleep on0， 都 会 调用 
sleep_on_common()， 其 流程 如 下 。 

(1) 定义 并 初始 化 一 个 等 待 队 列 ， 将 进程 状态 改变 为 TASK_UNINTERRUPTIBLE (不 能 被 信 
号 打 断 ) 或 TASK _ INTERRUPTIBLE《〈 可 以 被 信号 打 断 )， 并 将 等 待 队列 添加 到 等 待 队列 头 。 

(2) 通过 schedule timeoutO 放 弃 CPU 〈 这 两 个 函数 传递 的 超时 参数 都 是 MAX SCHEDULE - 
TIMEOUT， 即 不 会 发 生 超时 )， 调 度 其 他 进程 执行 。 

G) 进程 被 其 他 地 方 唤醒 ， 将 等 待 队列 移出 等 待 队列 头 。 

在 内 核 中 使 用 set current state(0) 函 数 或 ” add. current. state(0) 函 数 来 实现 目前 进程 状态 的 改 
变 ， 直 接 采 用 current->state = TASK UNINTERRUPTIBLE 类 似 的 赋值 语句 也 是 可 行 的 。 通 常 而 
Ti, set current state() 函数 在 任何 环境 下 都 可 以 使 用 ， 不 会 存在 并 发 问题 ， 但 是 效率 要 低 于 
. add current state(). 


因此 ,在 许多 设备 驱动 中 ， 并 不 调用 sleep on()2X interruptible sleep _on0， 而 是 亲自 进行 进程 
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的 状态 改变 和 切换 ， 如 代码 清单 8.6 所 示 。 
代码 清单 8.6 ”在 驱动 程序 中 改变 进程 状态 并 调用 schedule() 























1 static ssize t xxx write(struct file *file, const char *buffer, size t count, 
2 loff t *ppos) 
Sh 
4 E 
5 DECLARE WAITQUEUE (wait, current); /* 定义 等 待 队列 */ 
6 add wait queue(&xxx wait, &wait); /* 添加 等 待 队列 */ 
7 
8 ret = count; 
9 /* 等 待 设备 缓冲 区 可 写 */ 
0 ao 4 
avail = device writable(...); 
2 alic lewa “< O) 
13 |J set current state(TASK INTERRUPTIBLE);/* 改变 进程 状态 */ 
4 
5 if (avail « O) ( 
16 if (file->f flags &O NONBLOCK) (/* 非 阻 塞 */ 
7 ic (Irez) 
8 ret = - EAGAIN; 
9 goto out; 
20 } 
21 schedule () ; /* 调度 其 他 进程 执行 
22 if (signal pending(current)) {/* 如 果 是 因为 信号 唤醒 */ 
23 if (!ret) 
24 ret = - ERESTARTSYS; 
25 GOLO OUE, 
26 } 
27 } 
28 }while (avail < 0); 
209 





30 /* 写 设备 缓冲 区 */ 

31 device write(...) 

32 ONES 

33 remove wait queue(&xxx wait, &wait);/* 将 等 待 队列 移出 等 待 队 列 头 */ 
34 set current state(TASK RUNNING) ;/* 设 置 进程 状态 为 TASK RUNNING*/ 
35 return ret; 

SON 


读 懂 代 码 清单 8.6 对 理解 Linux 进程 状态 切换 非常 重要 ， 所 以 提请 读者 反复 阅读 此 段 代码 ( 尤 
其 注意 其 中 黑体 的 部 分 )， 直 至 完全 领悟 。 几 个 要 点 如 下 。 

QD 如 果 是 非 阻塞 访问 CO NONBLOCK 被 设置 )， 设 备 忙 时 ， 直 接 返 回 “-EAGAIN ". 

@ 对 于 阻塞 访问 ， 会 进行 状态 切换 并 显 式 通 过 “schedule() ”调度 其 他 进程 执行 ; 

© 醒 来 的 时 候 要 注意 ， 由 于 调度 出 去 的 时 候 ， 进 程 状态 是 TASK INTERRUPTIBLE, Ri 
度 睡 眠 ， 因 此 唤醒 它 的 有 可 能 是 信号 ， 因 此 ， 我 们 首先 通过 “signal pending(currenD ”了解 是 不 
是 信号 唤醒 的 ， 如 果 是 ， 立 即 返 回 “- ERESTARTSYS ". 


8.1.2 ”支持 阻塞 操作 的 globalfifo 设备 驱动 


现在 我 们 给 globalmem 增加 这 样 的 约束 : 把 globalmem 中 的 全 局 内 存 变 成 一 个 FIFO， 只 有 当 





































































































































































































gdi 









































































































































T 




















INUX 


Linux 设备 驱动 中 的 阻塞 与 非 阻塞 1O e 


FIFO 中 有 数据 的 时 候 ( 即 有 进程 把 数据 写 到 这 个 FIFO 而 且 没有 被 读 进 程 读 空 )， 读 进程 才能 把 
dud 而 且 读 取 后 的 数据 会 从 globalmem 的 全 局 内 存 中 被 拿 掉 ， 只 有 当 FIFO 非 满 时 《〈 即 还 
有 一 些 空间 未 被 号， 或 写 满 后 被 读 进 程 从 这 个 FIFO 中 读 出 了 数据 )， 写 进程 才能 往 这 个 FIFO 中 
写 入 数据 。 

现在 ， 将 globalmem 重 命名 为 “globalfifo”， 在 globalfifo 中 ， 读 FIFO 将 唤醒 写 FIFO， 而 写 
FIFO 也 将 唤醒 读 FIFO。 首 先 ， 需 要 修改 设备 结构 体 ， 在 其 中 增加 两 个 等 待 队 列 头 ， 分 别 对 应 于 
读 和 写 ， 如 代码 清单 8.7 所 示 。 


代码 清单 8.7 globalfifo 设备 结构 体 
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1 struct globalfifo dev i 

2 struct cdev cdev; /*cdev 结构 体 */ 

3 unsigned int current len; /*fifo 有 效 数据 长 度 */ 

4 unsigned char mem[GLOBALFIFO SIZE]; /* 全 局 内 存 */ 

5 struct semaphore sem; /* 并 发 控制 用 的 信号 量 */ 

6 wait queue head t r wait; /# 阻 塞 读 用 的 等 待 队列 头 */ 

7 wait queue head t w wait; /# 阻 塞 写 用 的 等 待 队列 头 */ 

8 5 

5j globalfifo 设备 结构 体 的 另 一 个 不 同 是 增加 了 current. len 成 员 用 于 表征 目前 FIFO 中 有 效 数 
ETE 























这 个 等 待 队 列 需 在 设备 驱动 模块 加 载 函数 中 调用 init waitqueue_head0 被 初始 化 ， 新 的 设备 驱 
动 模块 加 载 函 数 如 代码 清单 8.8 所 示 。 


代码 清单 8.8 globalfifo 设备 驱动 模块 加 载 函 数 











































































































ne obo se (ie) 

2- 4 

3 int ret; 

4 dev t devno = MKDEV (globalfifo major, 0); 

8 

6 /* 申请 设备 号 */ 

7 if (globalfifo major) 

8 ret = register chrdev region(devno, 1, "globalfifo"); 
9 else ( /* 动态 申请 设备 号 */ 

0 ret = alloc chrdev region(&devno, 0, 1, "globalfifo"); 
1L globalfifo major - MAJOR (devno); 

2 } 

3 if (ret « O0) 

4 return ret; 

5 /* 动态 申请 设备 结构 体 的 内 存 */ 

6 globalfifo devp = kmalloc(sizeof(struct globalfifo dev), GFP KERNEL); 
7 if (!globalfifo devp) (  /*HBiXAW*/ 

8 ret = - ENOMEM; 

9 goto orallomabtloc: 
20 } 
21 
22 memset(globalfifo devp, 0, sizeof(struct globalfifo dev)); 
23 
24 globalfifo setup cdev(globalfifo devp, 0); 
25 
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26 init MUTEX(&globalfifo devp-»sem); ”/* 初 始 化 信号 量 */ 
27 init waitqueue head(&globalfifo devp->r wait); /* 初 始 化 读 等 待 队 列 头 */ 
28 init waitqueue head(&globalfifo devp->w wait); /* 初 始 化 写 等 待 队列 头 */ 








zw 

30 return 0; 

SI 

o fail malloc: unregister chrdev region(devno, 1); 

9 return ret; 

34 ] 

设备 驱动 读 写 操作 需要 被 修改 ， 在 读 函 数 中 需 增 加 等 待 globalfifo devp-7w wait 被 唤醒 的 语 


` 


而 在 写 操作 中 唤醒 globalfifo_devp->r wait， 如 代码 清单 8.9 所 示 。 


代码 清单 8.9 ”增加 等 待 队列 后 的 globalfifo 读 写 函数 
/*globalfifo 读 函数 */ 
2 static ssize t globalfifo read(struct file *filp, char user *buf, size t 





















































3 count, loff t *ppos) 

4 { 

5 int ret; 

6 struct globalfifo dev *dev = filp-»private data; /* 获得 设备 结构 体 指针 
7 DECLARE WAITQUEUE (wait, current); /* 定义 等 待 队列 

8 

9 down(&dev-»sem); /* 获得 信号 量 

10 add wait queue(&dev-»r wait, &wait); /* 进入 读 等 待 队列 头 
12 /* SIF FIFOdEZ */ 

13 while (dev-»current len == 0) ( 

14 if (filp->f flags &O NONBLOCK) ( 

15 ret = - EAGAIN; 

16 oe oon 

153] ) 

18 . set current state(TASK INTERRUPTIBLE); /* 改变 进程 状态 为 睡眠 
1:9 up(&dev-»sem); 

20 

21 schedule(); /* 调度 其 他 进程 执行 

22 if (signal pending(current))  (/* 如 果 是 因为 信号 唤醒 */ 
2:9) ret = - ERESTARTSYS; 

24 COTO OU 

25) } 

26 

2d down (&dev-»sem) ; 

28 } 

289 

30 /* FEWER SIR] */ 

SH if (count » dev-»current len) 

92 count = dev-»current len; 

33 

34 if (copy_to_user (buf, dev->mem, count)) { 

35 ret = - EFAULT; 

36 goEo ome 

2 ) else ( 

38 memcpy (dev-»mem, dev-»mem + count, dev-»current len - count); /* fifo 数据 前 移 */ 
39 dev-»current len -= count; /* 有 效 数据 长 度 减少 
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© 

40 printk(KERN INFO "read $d bytes(s),current len:%d\n", count, dev ® 
41 -»current len); 
42 
43 wake up interruptible(&dev-»w wait); /* 唤醒 写 等 待 队 列 */ 
44 
45 Pet cope 
46 } 
47 out: up(&dev-»sem); /* 释放 信号 量 
48 out2: remove wait queue(&dev-»w wait, &wait); /* 移 除 等 待 队列 */ 
49 set current state (TASK RUNNING); 
50 return ret; 
Sd ) 
32 
53 
54  /*globalfifo 写 操作 */ 
55 static ssize t globalfifo write(struct file *filp, const char user *buf, 
56 Sz cNUCOUnts Me oT ME EET OS) 
57 { 
58 struct globalfifo dev *dev = filp->private data; /* 获得 设备 结构 体 指针 */ 
J9 int pets 
60 DECLARE WAITQUEUE (wait, current); /* 定义 等 待 队列 */ 
61 
62 down(&dev-»sem); /* 获取 信号 量 */ 
63 add wait queue(&dev-»w wait, &wait); /* 进入 写 等 待 队列 头 */ 
64 
65 /* 等 待 FIFO 非 满 */ 
66 while (dev->current len == GLOBALFIFO SIZE) { 
67 crorkxlo-esr clags A&OINONBLOCEKR 
68 /* 如 果 是 非 阻 塞 访问 */ 
69 ret = - EAGAIN; 
70 goto out; 
3L ) 
72 . set current state (TASK INTERRUPTIBLE); /* 改变 进程 状态 为 睡眠 */ 
73 up(&dev-»sem); 
74 
75 schedule(); /* 调度 其 他 进程 执行 */ 
76 if (signal pending(current)) { 
71 /* 如 果 是 因为 信号 唤醒 */ 
78 ret =. = ERESTARTSYS; 
9 goto out2; 
80 } 
81 
82 down (&dev->sem); /* 获得 信号 量 */ 
83 } 
84 
85 /* 从 用 户 空间 拷贝 到 内 核 空 间 */ 
86 if (count > GLOBALFIFO SIZE - dev-»current len) 
87 count — GLOBALNKIFO SIZE-- dev-scurrent len; 
88 
99 if (copy from user(dev-»mem + dev-»current len, buf, count)) { 
90 ret = = EFAULT; 
91 goto out; 
92 ) else ( 
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23 dev->current_len += count; 

94 printk(KERN INFO "written $d bytes(s),current len:%d\n", count, dev 
25 -»current len); 

96 

97 wake up interruptible(&dev-»r wait); /* 唤醒 读 等 竺 队列 */ 

98 

99 ret = count; 

00 J 

01 


02 out: up(&dev-»sem); /* 释放 信号 量 */ 

103 out2: remove wait queue(&dev-»5w wait, &wait); 
104 set current state (TASK RUNNING); 

05 return ret; 

06 } 


在 代码 清单 8.9 H, ZEB 











NE 














管 了 等 待 队列 进出 和 进程 切换 的 过 程 ， 现 在 会 有 一 个 疑问 
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可 以 把 读 函 数 中 一 大 段 用 于 等 待 dev->current len != 0 的 内 容 直 接 用 wait event interruptible(dev-— 
r wait, dev->current_len != 0) 蔡 换 , 把 写 函 数 中 一 大 段 用 于 等 待 dev->current len != GLOBALFIFO_ 










































































SIZE 的 代码 用 wait event_interruptible(dev->w_wait, dev->current len != 0) 蔡 换 呢 ? 
实际 上 ， 就 控制 等 待 队 列 非 空 和 非 满 的 角 / 

current len != 0) 和 第 13 一 28 行 代码 的 功能 

dev-»current len != 0) 和 第 66 一 83 行 代码 的 功能 
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的 动作 意义 重大 ， 非 如 此 ， 则 死 锁 将 不 可 避免 。 











如 图 8.1 Ca) 所 示 ， 假 设 目前 的 FIFO 为 空 即 dev->current len 为 0， 此 时 如 果 有 一 个 读 进程 
































已 会 先 获 得 信号 量 ， 因 为 条 件 不 满足 ， 它 将 因为 wait event interruptible(dev-r wait, 








度 而 言 ，wait_event interruptible(dev->r wait，dev-> 
完全 一 样 ，wait_event interruptible(dev->w_wait, 
完全 一 样 。 细 微 的 区 别 体现 在 第 13 —28 行 代码 和 
第 66—83 行 代码 在 进行 schedule() 即 切换 进程 前 ， 通 过 up(&dev->sem) 释 放 了 信号 量 。 这 一 细微 





dev-> 


current len != 0) 而 阻塞 ,而 释放 dev->r_wait 等 待 队列 及 让 dev->current_len != 0 的 操作 又 需要 在 写 
































进程 中 进行 ， 写 进程 在 执行 写 操作 前 又 必须 等 待 读 进程 释放 信和 号 量 ， 造 成 互相 等 待 对 方 资 
盾 局 面 ， 从 而 死 锁 。 
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如 图 8.1 (b) 所 示 ， 假 设 目前 的 FIFO 为 满 即 dev->current len 为 GLOBALEFIFO_SIZE， 此 时 


如 果 有 一 个 写 进程 , 它 先 获 得 了 信号 量 , 因为 条 件 不 满足 , 它 将 因为 wait event interruptible(dev- 
w_wait, dev->current len != GLOBALFIFO SIZE) 而 阻塞 ， 而 释放 dev->w_wait 等 待 队列 及 让 
dev-»current len != GLOBALFIFO SIZE 的 操作 又 需要 在 读 进程 中 进行 ， 读 进程 在 执行 读 操作 前 又 
































必须 等 待 写 进程 释放 信号 量 ， 造 成 互相 等 待 对 方 资源 的 矛盾 局 面 ， 从 而 死 锁 。 


























读 5 


down_interruptible(&dev->sem)) 
down _interruptible(&dev->sem)) 





wait_event_interruptible(dev->r_wait, dev->current len != ~g 


up(&dev->sem)) Mese gs 


f$ 


Euer. 等待 up(&dev->sem)) 


(a ) 队列 为 空 时 的 死 锁 


< wake up interruptible(&dev->r wait); 
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nc 


写 读 


eo 


down interruptible(&dev-^sem)) 


. ; ; ; down _interruptible(&dev->sem 
wait_event_interruptible(dev->w_wait, dev->current len != 2 P ( » 


GLOBALFIFO SIZE) 


up(&dev-»sem)) c 






< wake up interruptible(&dev-w wait); 


up(&dev-»sem)) 


( b ) 队列 为 满 时 的 死 锁 
图 8.1 等 待 队列 、 信 号 量 等 引起 的 死 锁 



































所 谓 死 锁 ， 就 是 多 个 进程 循环 等 待 它 方 占有 的 资源 而 无 限期 地 僵持 下 去 的 局 面 。 如 果 没 有 外 
力 的 作用 ， 那 么 死 锁 涉及 的 各 个 进程 都 将 永远 处 于 封锁 状态 。 因 此 ， 了 驱动 工程 师 一 定 要 注意 : 当 
多 个 等 待 队列 、 信 号 量 等 机 制 同时 出 现时 ， 谨 防 死 锁 ! 

现在 回 过 来 了 看 一 下 代码 清单 8.9 的 第 15 行 和 75 行 ， 发 现在 设备 驱动 的 read0、write0 等 功 
能 函数 中 ， 可 以 通过 filp->f flags 标志 获得 用 户 空间 是 否 要 求 非 阻塞 访问 。 驱 动 中 可 以 依据 此 标 
志 判 断 用 户 究竟 要 求 阻塞 还 是 非 阻塞 访问 ， 从 而 进行 不 同 的 处 理 


8.1.3 在 用 户 空 间 验 证 globalfifo 的 读 写 


/home/lihacker/develop/svn/ldd6410-read-only/training/kernel/drivers/globalfifo/ch8 包含 了 globalfifo 的 
了 驱动， 运行 “make” 命 令 编译 得 到 globalfifo.ko。 接 着 insmod 模块 : 


lihacker@lihacker-laptop:~/develop/svn/ldd6410-read-only/training/kernel/drivers/gl 
obalfifo/ch8$ sudo su 
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rootGülihacker-laptop:/home/lihacker/develop/svn/l1dd6410-read-only/training/kernel/ 
drivers/globalfifo/ch84 insmod globalfifo.ko 


创建 设备 文件 节点 “/dev/globalfifo”: 

rootülihacker-laptop:/home/lihacker/develop/svn/ldd6410-read-only/training/kernel/ 

drivers/globalfifo/ch84 mknod /dev/globalfifo c 249 0 

启动 两 个 进程 , 一 个 进程 “cat /dev/globalfifo&” 在 后 台 执 行 , 一 个 进程 “echo FFE /dev/globalfifo " 

在 前 台 执 行 : 
root@lihacker-laptop:/home/lihacker/develop/svn/1dd6410-read-only/training/kernel/ 


drivers/globalfifo/ch8# cat /dev/globalfifo & 
E2200 


















































root@lihacker-laptop:/home/lihacker/develop/svn/1dd6410-read-only/training/kernel/ 
drivers/globalfifo/ch8# echo 'I want to be' > /dev/globalfifo 
I want to be 


rootGülihacker-laptop:/home/lihacker/develop/svn/l1dd6410-read-only/training/kernel/ 
drivers/globalfifo/ch84 echo 'a great Chinese Linux driver Engineer' > /dev/globalfifo 
a great Chinese Linux driver Engineer 


每 当 echo 进程 向 /dev/globalfifo 写 入 一 串 数据 ，cat 进程 就 立即 将 该 串 数 据 显现 出 来 ， 好 的 ， 


让 我 们 抱 着 这 个 信念 “I want to be a great Chinese Linux driver Engineer” 继 续 前 行 吧 ! 
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8.2 E 


8.2.1 


的 应 用 程序 通常 会 使 用 selectÓ I poll0 系 统 调 用 查询 是 否 可 对 设备 进行 无 阻 
poll0 系 统 调用 最 终 会 引发 设备 驱动 中 的 poll0 函 数 被 执行 ， 在 2.5.45 内 核 中 


扩展 的 poll0。 














在 ) 














户 程 序 




































































select() 和 


poll0 系 统 调 


轮 询 的 概念 与 作用 


， select FI 


























poll0 也 是 与 设备 阻塞 与 非 阻 塞 访问 息息相关 的 论 





























题 。 使 用 非 阻塞 IO 
塞 的 访问 。select0 和 





























还 引入 了 epoll0， 即 
































8.22 ”应 用 程序 中 的 轮 询 编程 




















的 本 质 一 样 ， 前 者 在 BSD UNIX 中 引入 ， 后 者 在 System V 中 引入 。 





































































































应 用 程序 中 最 广泛 用 到 的 是 BSD UNIX 中 引入 的 select0 系 统 调用 ， 其 原型 为 : 

int select(int numfds, fd set *readfds, fd set *writefds, fd set *exceptfds, struct 
timeval *timeout); 

其 中 readfds. writefds. exceptfds 分 别 是 被 selectO0 监 视 的 读 、 写 和 异常 处 理 的 文件 描述 符 集 
人 


类 型 的 指针 ， 它 可 以 使 select(O 在 等 待 timeout 时 


数据 结构 的 定义 如 代码 清单 


8.2.3 


Wik 
































合 ，numfds 的 值 是 需要 检查 的 号 码 最 高 的 文人 




















struct timeval 








2 aou ue Oee f 
3 int tv usec; 
4j; 

列 操作 














FD ZERO(fd set 
清除 一 个 文件 
































设备 驱动 ! 





*set) 
描述 符 集 ; 
FD SET(int fd,fd set *set) 

将 一 个 文件 描述 符 加 入 文件 描述 符 集中 ; 
FD CLR(int fd,fd set *set) 
将 一 个 文件 描述 符 从 文件 描述 符 集中 清除 ; 
FD ISSET(int fd,fd set *set) 


判断 文件 描述 符 是 否 被 置 位 。 


设备 驱动 中 的 轮 询 编程 


poll0 函 数 的 原型 是 : 


T 





























8.10 所 示 。 
代码 清单 8.10 timeval 结构 体 定义 


dm eu) 
/* fA *J 





j 来 设置 、 清 除 、 判 断 文件 描述 符 集合 ; 









































unsigned int(*poll) (struct file * filp, struct poll table* wait); 














描述 符 加 I. timeout 参数 是 一 个 指向 struct timeval 
j 间 后 若 没 有 文件 描述 符 准 备 好 则 返回 。 





struct timeval 














第 1 个 参数 为 file 结构 体 指针 ， 第 2 个 参数 为 轮 询 表 指针 。 这 个 函数 应 该 进行 两 项 











工作 。 





CD 对 可 能 引起 设备 文件 状态 变化 的 等 待 队 列 调用 poll_waitO 函 数 ， 将 对 应 的 等 待 队列 头 添 


I| poll table. 
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(2) 返回 表示 是 否 能 对 设备 进行 无 阻塞 读 、 写 访问 的 掩 码 。 

关键 的 用 于 向 poll. table 注册 等 待 队 列 的 poll_waitO 函 数 的 原型 如 下 ; 

void poll wait(struct file *filp, wait queue heat t *queue, poll table * wait); 

pollL_waitO 函 数 的 名 称 非常 容易 让 人 产生 误会 ， 以 为 它 和 wait_event0 等 一 样 ， 会 阻塞 地 等 待 
某 事 件 的 发 生 ， 其 实 这 个 函数 并 不 会 引起 阻塞 。poll_waitO 函 数 所 做 的 工作 是 把 当前 进程 添加 到 
wait 参数 指定 的 等 待 列 表 Cpoll table) 中 。 

驱动 程序 pol0 函 数 应 该 返回 设备 资源 的 可 获取 状态 ， 即 POLLIN、POLLOUT、POLLPRI、 
POLLERR. POLLNVAL 等 宏 的 位 “或 ”结果 。 每 个 宏 的 含义 都 表明 设备 的 一 种 状态 ， 如 POLLIN 
(定义 为 0x0001) 意味 着 设备 可 以 无 阻塞 地 读 ，POLLOUT (定义 为 0x0004) 意味 着 设备 可 以 无 
阻塞 地 写 。 
通过 以 上 分 析 ， 可 得 出 设备 驱动 中 poll0 函 数 的 典型 模板 ， 如 代码 清单 8.11 所 示 。 


代码 清单 8.11 poll() 函 数 典 型 模板 


static unsigned int xxx poll(struct file *filp, poll table *wait) 




















t 




























































































































































































PET 

3 unsigned int mask - 0; 

4 struct xxx dev *dev = filp-»private data; /* 获 得 设备 结构 体 指针 */ 
E 

6 den 

7 poll wait(filp, &dev-»r wait, wait);/* 加 读 等 待 队 列 头 */ 
8 poll wait(filp, &dev-»w wait, wait);/* 加 写 等 待 队列 头 */ 
9 

9 38 (225) 46 wipe v 

1 mask |= POLLIN | POLLRDNORM; /* 标 示 数 据 可 获得 */ 

2 

S Te Je WB v 

4 mask |= POLLOUT | POLLWRNORM; /* 标 示 数 据 可 写 入 */ 

6 return mask; 

Aog 








8.3 支持 轮 询 操 作 的 globalfifo 驱动 


8.3.1 在 globalfifo 驱动 中 增加 轮 询 操作 

在 globalfifo 的 pol0O 函 数 中 ， 首 先 将 设备 结构 体 中 的 r wait 和 w_wait 等 待 队列 头 添加 到 等 待 
列表 ， 然 后 通过 判断 dev->current_len 是 否 等 于 0 来 获得 设备 的 可 读 状 态 ， 通 过 判断 dev->current_len 
是 否 等 于 GLOBALFIFO_SIZE 来 获得 设备 的 可 写 状态 ， 如 代码 清单 8.12 所 示 。 






































































































































代码 清单 8.12 ”globalfifo 设备 驱动 的 poll() 函 数 
1 static unsigned int globalfifo poll(struct file *filp, poll table *wait) 
2 
3 unsigned int mask - 0; 
4 struct globalfifo dev *dev = filp-»private data; /* 获 得 设备 结构 体 指针 */ 
5 
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M DO I LION 





iea dO CHICO aS tO iuvet CE 


FH 
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} 
意 


意 ， 要 把 globalfifo poll 赋 给 globalfifo fops 的 poll 成 员 : 


down (&dev-»sem); 


poll wait(filp, &dev-»r wait, 
poll wait(filp, &dev-»w wait, 


o 


if (dev->current_len != 0) 
| POLLRDNORM; /* 标 示 数 据 可 获得 */ 


mask |= POLLIN 
/*£ifo 非 满 */ 


wait); 


wait); 


if (dev-»current len !- GLOBALFIFO SIZE) 
T | POLLWRNORM; /* 标 示 数 据 可 写 入 */ 


mask |- POLLOU 


p(&dev-»sem) ; 
return mask; 





Static const struct file operations globalfifo fops = { 


}; 


polt o globablfifopoll, 


8.3.2 ”在 用 户 空间 验证 globalfifo 设备 的 轮 询 























一 个 应 用 程序 pollmonitor.c 用 于 监控 globalfifo 的 可 读 写 状态 ， 这 个 程序 如 代码 




















&rfds, &wfds, 


监控 globalfifo 是 否 可 非 阻塞 读 写 




















O RDONLY | O NONBLOCK); 


« 0) 


NULL, NULL); 


编写 
所 示 。 
代码 清单 8.13 

1 #include 

2 

3 s4define FIFO CLEAR 0x1 

4 #define BUFFER LEN 20 

5 main() 

$ 4 

7 due, ftl, NA 

8 char rd ch[BUFFER LEN]; 

9 fd set rfds,wfds; /* 读 / 写 文件 描述 符 集 
0 
1 ，/# 以 非 阻 塞 方式 打开 /dev/globalfifo 设备 文件 */ 
2 fd = open("/dev/globalfifo", 

E aur. Wegel qo c 43Dy di 

4 /*FIFO 清 0*/ 

5 TI (IoSU rq, PIFOOCGhEAS. 0) 
6 printf("ioctl command failedWn") 
3 
8 while (1) ( 
9 FD ZERO (&rfds); 

20 FD ZERO(&wfds); 

2 FD SET(fd, &rfds); 

22 FD SET(fd, &wfds); 

25) 

24 select(fd + 1, 

25 /* 数 据 可 获得 */ 

26 TE (nD SS ly CEPfdasy) 





的 应 用 程序 























8.13 
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2 printf("Poll monitor:can be readWn"); 

28 /* 数 据 可 写 入 */ 

219 TER EDATS SENEE WEAS) 

30 printri"Poll monitorscaun-be written" 
E ) 

32 P eles i 

33 printf("Device open failureWMn"); 

34 } 

SEM 














运行 时 看 到 ， 到 没有 任何 输入 ， 即 FIFO 为 空 时 ， 程 序 不 断 地 输出 “Poll monitor:can be written”, 
当 通 过 echo [n]/dev/globalfifo 写 入 一 些 数据 后 ， 将 输出 “Poll monitor:can be read” 和 “了 Poll monitor:can 
be written”， 如 果 不 断 地 通过 echo 向 /dev/globalfifo 写 入 数据 直至 写 满 FIFO, RI pollmonitor 











































































































程序 将 只 输出 “Poll monitor:can be read”。 对 于 globalfifo 而 言 ， 不 会 出 现 既 不 能 读 、 又 不 能 写 
的 情况 。 








34 


阻塞 与 非 阻 塞 访问 是 VO 操作 的 两 种 不 同 模 式 ， 前 者 在 UO 操作 和 暂时 不 可 进行 时 会 让 进程 睡 
眠 ， 后 者 则 不 然 。 

在 设备 驱动 中 阻塞 UO 一 般 基 于 等 待 队列 来 实现 ， 等 待 队列 可 用 于 同步 驱动 中 事件 发 生 的 先 
后 顺序 。 使 用 非 阻塞 IO 的 应 用 程序 也 可 借助 轮 询 函 数 来 查询 设备 是 否 能 立即 被 访问 ， 用 户 空间 
调用 select0 和 poll0 接 口 ， 设 备 驱动 提供 poll0 函 数 。 设 备 驱 动 的 poll0 本 身 不 会 阻塞 ,但 是 poll0 
和 select(0 系 统 调用 则 会 阻塞 地 等 待 文件 描述 符 集合 中 的 至 少 一 个 可 访问 或 超时 。 
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本 章 导 读 


EREI 
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动 中 使 用 异步 通知 可 以 使 得 对 设备 的 访问 可 进行 时 , 由 驱动 
























































程序 进行 访问 。 这 样 ， 使 用 无 阻塞 IO 的 应 用 程序 无 需 轮 询 






































设备 是 否 可 访问 ， 而 阻塞 访问 也 可 以 被 类 似 “ 中 断 ” 的 异步 通知 所 取代 。 
9.1 节 讲 解 了 异步 通知 的 概念 和 作用 ，9.2 节 讲 解 了 Linux 异步 通知 的 
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编程 方法 ，9.3 节 给 出 了 增加 异步 通知 的 globalfifo 驱动 及 其 在 用 户 空间 的 


验证 
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套 机 制 就 更 加 完整 了 。 

异步 通知 的 意思 是 : 一 旦 设备 就 绪 ， 则 主动 通知 应 用 程序 ， 这 样 应 用 程序 根本 就 不 需要 查询 
设备 状态 ， 这 一 点 非常 类 似 于 硬件 上 “中 断 ” 的 概念 ， 比 较 准 确 的 称谓 是 “信号 驱动 的 异步 /O”。 
信号 是 在 软件 层次 上 对 中 断 机 制 的 一 种 模拟 ， 在 原理 上 ， 一 个 进程 收 到 一 个 信号 与 处 理 器 收 到 
个 中 断 请 求 可 以 说 是 一 样 的 。 信 号 是 异步 的 ， 一 个 进程 不 必 通 过 任何 操作 来 等 待 信号 的 到 达 ， 
实 上 ， 进 程 也 不 知道 信号 到 底 什 么 时 候 到 达 。 
阻塞 IO 意味 着 一 直 等 待 设备 可 访问 后 再 访问 ， 非 阻塞 WO 中 使 用 poll0 意 味 着 查询 设备 是 否 
可 访问 ， 而 异步 通知 则 意味 着 设备 通知 自身 可 访问 ， 实 现 了 异步 TO。 由 此 可 见 ， 这 几 种 方式 IO 
可 以 互 为 补充 。 
图 9.1 呈现 了 阻塞 IJO， 结 合 poll0 的 非 阻 塞 IO 及 异步 通知 在 时 间 先 后 顺序 上 的 不 同 。 
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但 是 如 果 有 了 异步 通知 整 
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图 9.1 阻塞 、 非 阻塞 VO、 异 步 通知 区 别 












































这 里 要 强调 的 是 ， 阻 塞 、 非 阻塞 TO、 异 步 通知 本 身 没 有 优 劣 ， 应 该 根据 不 同 的 应 用 场景 合 


Linux 异步 通知 编程 


9.2.1 Linux 信号 


使 用 信号 进行 进程 间 通 信 〈IPC) 是 UNIX 中 的 一 种 传统 机 制 ，Linux 也 支持 这 种 机 制 。 
Linux 中 ， 异 步 通知 使 用 信号 来 实现 ，Linux 中 可 用 的 信号 及 其 定义 如 表 9-1 所 示 。 
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表 9-1 Linux 信号 
信 号 值 £ X 
SIGHUP 1 挂 起 
SIGINT 2 终端 中 断 
SIGQUIT 3 终端 退出 
SIGILL 4 无 效 命令 
SIGTRAP 5 跟踪 陷阱 
SIGIOT 6 IOT 陷阱 
SIGBUS 7 BUS 错误 
SIGFPE 8 浮 点 异常 
SIGKILL 9 强行 终止 (不 能 被 捕获 或 忽略 ) 
SIGUSRI 0 户 定义 的 信号 1 
SIGSEGV 1 无 效 的 内 存 段 处 理 
SIGUSR2 2 户 定义 的 信号 2 
SIGPIPE 3 半 关 闭 管 道 得 写 操作 已 经 发 生 
SIGALRM 4 计时 器 到 期 
SIGTERM 5 终止 
SIGSTKFLT 6 堆栈 错误 
SIGCHLD 7 子 进程 已 经 停止 或 退出 
SIGCONT 8 如 果 停 止 了 ， 继 续 执 行 
SIGSTOP 9 停止 执行 (不 能 被 捕获 或 忽略 ) 
SIGTSTP 20 终端 停止 信号 
SIGTTIN 21 后 台 进 程 需 要 从 终端 读 取 输入 
SIGTTOU 22 后 台 进 程 需 要 向 从 终端 写 出 
SIGURG 23 紧急 的 套 接 字 事 件 
SIGXCPU 24 超额 使 用 CPU 分 配 的 时 间 
SIGXFSZ 25 文件 尺寸 超额 
SIGVTALRM 26 虚拟 时 钟 信号 
SIGPROF 27 才 钟 信号 描述 
SIGWINCH 28 窗口 尺寸 变化 
SIGIO 29 UO 
SIGPWR 30 LUE 
除了 SIGSTOP 和 SIGKILL 两 个 信号 外 ， 进 程 能 够 忽略 或 捕获 其 他 的 全 部 信号 。 一 个 信号 被 
有 获 的 意思 是 当 一 个 信号 到 达 时 有 相应 的 代码 处 理 它 。 如 果 一 个 信号 没有 被 这 个 进程 所 捕获 ， 内 
核 将 采用 默认 行为 处 理 。 
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9.2.2 ”信号 的 接收 
在 用 户 程序 中 ， 为 了 捕获 信号 ， 可 以 使 用 signal() 函 数 来 设置 对 应 信号 的 处 理 函 数 : 


void (*signal(int signum, void (*handler)) (int))) (int); 
该 函数 原型 较 难 理解 ， 它 可 以 分 解 为 : 


typedef void (*sighandler t) (int); 






















































































sighandler t signal(int signum, sighandler t handler)); 


第 一 个 参数 指定 信号 的 值 ， 第 二 个 参数 指定 针对 前 面 信 号 值 的 处 理 函 数 ,， 若 为 SIG. IGN, 表示 
忽略 该 信号 ; 若 为 SIG_DFL， 表 示 采 用 系统 默认 方式 处 理 信号 ; 若 为 用 户 自 定义 的 函数 ， 则 信和 号 
被 捕获 到 后 ， 该 函数 将 被 执行 。 
如 果 signal0 调 用 成 功 ， 它 返回 最 后 一 次 为 信号 signum 绑 定 的 处 理 函 数 handler 值 ， 失 败 则 返 
回 SIG ERR. 
在 进程 执行 时 ， 按 下 “Ctrl +c” 将 向 其 发 出 SIGINT fi, kill 正在 运行 的 进程 将 向 其 发 出 
SIGTERM 信和 号， 代码 清单 9.1 的 进程 捕获 这 两 个 信号 并 输出 信号 值 。 


代码 清单 9.1 signal() 捕 获 信号 范例 
void sigterm handler (int signo) 


{ 
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printfi"Have caught Eig N.O. Sdin', signo). 
exit(0); 


int main(void) 

{ 

9 signal (SIGINT, sigterm_handler); 
10 Signal(SIGTERM, sigterm handler); 
al while (1); 


1 
2 
3 
4 
$9 
6 
7 
8 


13 return 0; 
14 } 


除了 signal0 函 数 外 ，sigaction0 函 数 可 用 于 改变 进程 接收 到 特定 信号 后 的 行为 ， 它 的 原型 为 : 


int sigaction(int signum,const struct sigaction *act, struct sigaction *oldact)); 

该 函数 的 第 一 个 参数 为 信号 的 值 ， 可 以 为 除 SIGKILL 及 SIGSTOP 外 的 任何 一 个 特定 有 效 的 
信号 。 第 二 个 参数 是 指向 结构 体 sigaction 的 一 个 实例 的 指针 ， 在 结构 体 sigaction 的 实例 中 ， 指 定 
了 对 特定 信号 的 处 理 函 数 ， 若 为 空 ， 则 进程 会 以 缺 省 方式 对 信号 处 理 ， 第 三 个 参数 oldact 指向 的 
对 象 用 来 保存 原来 对 相应 信号 的 处 理 函 数 ， 可 指定 oldact 为 NULL。 如 果 把 第 二 、 第 三 个 参数 都 
设 为 NULL， 那 么 该 函数 可 用 于 检查 信号 的 有 效 性 。 
先 来 看 一 个 使 用 信号 实现 异步 通知 的 例子 ， 它 通过 signal(SIGIO, input_handler) 对 标准 输入 文 
件 描 述 符 STDIN_FILENO 启动 信号 机 制 。 用 户 输入 后 ， 应 用 程序 将 接收 到 SIGIO 信号 ， 其 处 理 
函数 input handlerO 将 被 调用 ， 如 代码 清单 9.2 所 示 。 


代码 清单 9.2 ”使 用 信号 实现 异步 通知 的 应 用 程序 实例 


#include <sys/types.h> 
#include <sys/stat.h> 
#include <stdio.h> 
Ssinclude «fcntl.h» 
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5 d4include «signal.h» 
6 #include <unistd.h> 
7 t$define MAX LEN 100 
8 void input handler(int num) 








9 4 

0 

1l int len; 
2 

2 

4 

5 data[len] 
6 

S 

8 

9 main() 
20 ( 


ZI int oflags; 





char data[MAX LEN]; 


printf("input available:$s Nn", 


23  /* 启动 信号 驱动 机 制 */ 
24 signal(SIGIO, 2nput handler); 


25  fcntl(STDIN FILENO, 
26  oflags = fcntl(STDIN FILENO, 
27  fcntl(STDIN FILENO, 

















29  /* 最 后 进入 


个 死 循环 ， 仅 为 保持 进程 不 终止 ， 如 果 程序 中 


30 ”没有 这 个 死 循 会 立即 执行 完毕 */ 


31 while (1); 


Se y 





STDIN FILENO 文 从 












































am Chinese. 





love Linux 


input available: 








启用 异步 通知 机 
的 执行 效果 如 下 : 


root@localhost driver study]# 





input available: 








ERRI 24 行为 SIGIO 信号 安装 input handlerO 作 为 处 理 函 数 ， 第 25 行 设置 本 进程 为 
F 的 拥有 者 (owner)， 没 有 这 一 步 内 核 不 会 知道 应 该 将 信号 发 给 哪个 进程 。 而 

















/* 读 取 并 输出 STDIN_FILENO 上 的 输入 */ 
len = read (STDIN FILENO, &data, MAX LEN); 


(iiec 


F SETOWN, getpid(); 


F GETFL); 


ES EE lS EASYNC) 







































































吊 ， 还 需 对 设备 设置 FASYNC hk. 26—27 行 代 码 实 现 此 目的 。 整 个 程序 























am Chinese. 


driver. 


./Signal test 


love Linux driver. 





















































































































































从 中 可 以 看 出 ， JPN HE 
驱使 对 应 的 应 用 程序 中 由 

此 可 见 ， 为 了 在 用 户 空间 中 能 处 

(1) 通过 F SETOWN IO 控制 命令 
信号 才能 被 本 进程 接收 到 。 

(2) 通过 F_SETFL IO fi 























符 后 ， 标 准 输入 设备 释放 SIGIO fs^5, iam "UIT 











的 input_handler() 得 以 执行 ， 将 用 户 输入 显示 出 来 。 





























时 一 个 设备 释放 的 信号 ， 它 必须 完成 3 项 工作 。 
设置 设备 文件 的 拥有 者 为 本 进程 ， 这 样 从 设备 驱动 发 出 的 


















































命令 设置 设备 文件 支持 FASYNC， 即 异步 通知 模式 。 
























































G) 通过 signal0 函 数 连 接 信号 和 信号 处 理 函 数 。 








9.2.8 ”信号 的 释放 














在 设备 驱动 和 应 
没有 的 源头 在 设备 驱动 



































程序 的 异步 通知 











。 因 此 ， 应 该 











交互 中 ， 仅 仅 在 应 用 程序 端 捕获 信号 是 不 够 的 ， 因 为 信号 
在 合适 的 时 机 让 设备 驱动 释放 信号 ， 在 设备 驱动 程序 中 增 
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加 信和 号 释放 的 相关 代码 。 

为 了 使 设备 支持 异步 通知 机 制 ， 驱 动 程序 中 涉及 3 项 工作 。 

(1) 支持 F_SETOWN 命令 ， 能 在 这 个 控制 命令 处 理 中 设置 filp->f_owner 为 对 应 进程 ID 。 不 
过 此 项 工作 已 由 内 核 完成 ， 设 备 驱动 无 需 处 理 。 

(2) 支持 F_SETFL 命令 的 处 理 ， 每 当 FASYNC 标志 改变 时 ， 驱 动 程序 中 的 包 sync(O) 函 数 将 得 
以 执行 。 因 此 ， 驱 动 中 应 该 实现 fasyncO 函 数 。 

(3) 在 设备 资源 可 获得 时 ， 调 用 kill fasync0 函 数 激 发 相应 的 信号 
驱动 中 的 上 述 3 项 工作 和 应 用 程序 中 的 3 项 工作 是 一 一 对 应 的 ， 图 9.2 所 示 为 异步 通知 处 理 
过 程 中 用 户 空间 和 设备 驱动 的 交互 。 











































































































































































































signal () 绑 定 


用 户 空间 


fentl (fd, F_ SETOWN, getpid O)| | fentl (fd,F_GETFL) 信号 处 理 函 数 


内 核 设置 flp->f_ owner 设备 驱动 fasync () 函数 资源 可 获得 


内 核 空间 





9.2 ”异步 通知 中 设备 驱动 和 异步 通知 的 交互 























设备 驱动 中 异步 通知 编程 比较 简单 ， 主 要 用 到 一 项 数据 结构 和 两 个 函数 。 数 据 结构 是 
fasync struct 结构 体 ， 两 个 函数 分 别 是 : 
处 理 FASYNC 标志 变更 的 。 


int fasync helper(int fd, struct file *filp, int mode, struct fasync struct **fa); 
释放 信号 用 的 函数 。 

vorei en eave loc ne res sm a Tm 

和 其 他 的 设备 驱动 一 样 ， 将 fasyne struct 结构 体 指 针 放 在 设备 结构 体 中 仍然 是 最 佳 选择 ， 代 
码 清单 9.3 给 出 了 文 持 异 步 通知 的 设备 结构 体 模板 。 


代码 清单 9.3 ”支持 异步 通知 的 设备 结构 体 模板 


























































































































Jb St eo (ote 3l 

2 struct cdev cdev; /*cdev 结构 体 */ 

3 A 

4 struct fasync struct *async queue; /* 异步 结构 体 指针 */ 
S Jg 




















在 设备 驱动 的 fasync0 函 数 中 ， 只 需要 简单 地 将 该 函数 的 3 个 参数 以 及 fasyne. struct 结构 体 指 
针 的 指针 作为 第 4 个 参数 传 入 fasync_helper0 函 数 即 可 。 代 码 清单 9.4 给 出 了 支持 异步 通知 的 设备 
驱动 程序 fasync() 函 数 的 模板 。 


代码 清单 9.4 支持 异步 通知 的 设备 驱动 fasync() 函 数 模 板 


SEE 
CERT 
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3 
4 
5 


} 


struct xxx dev “dev = filp-»private data; 
return fasync helper(fd, filp, mode, &dev-»async queue); 

















在 设备 资源 可 以 获得 时 ， 应 该 调用 kill_fasyncO 释 放 SIGIO 信号 ， 可 读 时 第 3 个 参数 设置 为 
POLL _ IN， 可 写 时 第 3 个 参数 设置 为 POLL OUT。 代 码 清单 9.5 给 出 了 释放 信号 的 范例 。 


1 
2 
3 
4 
5 
6 
"7 
8 
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代码 清单 9.5 ”支持 异步 通知 的 设备 驱动 信号 释放 范例 


static ssize t xxx write(struct file *filp, const char user *buf, size t count, 


{ 


o 


最 后 ， 在 文件 关闭 时 ， 即 在 设备 驱动 的 release() 函 数 中 ， 应 调 


Oe ie EROS) 
Struct xxx dev *dev - filp-»private data; 


/* 产生 异步 读 信号 */ 
if (dev->async queue) 
kill fasync(&dev-»async queue, SIGIO, POLL IN); 


























设备 驱动 的 fasync() 




















上 
将 文件 从 异步 通知 的 列表 中 删除 。 代 码 清单 9.5 给 出 了 支 持 异 步 通知 的 设备 驱动 release() 


的 模板 。 
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9.3.1 
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代码 清单 9.6 ”支持 异步 通知 的 设备 驱动 release() 函 数 模板 


static int xxx release(struct inode *inode, struct file *filp) 


{ 














/* 将 文件 从 异步 通知 列表 中 删除 */ 
mox fees eM bu. endless. 0» 


return 0; 


9 3 支持 异步 通知 的 globalfifo 驱动 


在 globalfifo 驱动 中 增加 异步 通知 












































2 
3 
4 
9 
6 
7 
8 
9 








先 ， 参 照 代 码 清单 9.2， 应 该 将 异步 结构 体 指针 添加 到 glbalfifo dev 设备 结构 体内 ， 如 代 
码 清单 9.7 所 示 。 














代码 清单 9.7 ”增加 异步 通知 后 的 globalfifo 设备 结构 体 


struct globalfifo dev ( 


; 


struct cdev cdev; /*cdev 结构 体 */ 

unsigned int current len; /*fifo 有 效 数据 长 度 */ 
unsigned char mem[GLOBALFIFO SIZE]; /* 全 局 内 存 */ 
struct semaphore sem; /* 并 发 控制 用 的 信号 量 */ 
wait queue head t r wait; /# 阻 塞 读 用 的 等 待 队列 头 */ 

wait queue head t w wait; /# 阻 塞 写 用 的 等 待 队列 头 */ 

struct fasync struct *async queue; /* 异步 结构 体 指针 ， 用 于 读 */ 
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参考 代码 清单 9.3 的 fasync0 函 数 模板 ，globalfifo 的 这 个 函数 如 代码 清单 9.8。 











代码 清单 9.8 ”支持 异步 通知 的 globalfifo 设备 驱动 fasync() 函 数 
1 static int globalfifo fasync(int fd, struct file *filp, int mode) 
2 1 


3 struct globalfifo dev *dev = filp->private_data; 
4 return fasync_helper (fd, filp, mode, &dev->async queue); 
s 


eoe 
































在 globalfifo 设备 被 正确 写 入 之 后 ， 它 变 得 可 读 ， 这 个 时 候 驱 动 应 释放 SIGIO 信号 以 便 应 


























序 捕获 ， 代 人 码 清单 9.9 给 出 了 支持 异步 通知 的 globalfifo 设备 驱动 的 写 函 数 。 


代码 清单 9.9 支持 异步 通知 的 globalfifo 设备 驱动 写 函 数 


static ssize t globalfifo write(struct file *filp, const char user *buf, 





































































































2 Su zc cNEMCOuDE MIC NEED OS) 

ONE 

4 struct globalfifo dev *dev = filp-»private data; /* 获得 设备 结构 体 指针 */ 
5 int ret; 

6 DECLARE WAITQUEUE(wait, current); /# 定 义 等 待 队列 */ 

7 

8 down(&dev-»sem); /* 获 取信 号 量 */ 

9 add wait queue(&dev-»w wait, &wait); /# 进 入 写 等 待 队列 头 */ 
0 

1 /* 等 待 FIFO 非 满 */ 

2 if (dev-»current len == GLOBALFIFO SIZE) { 

3 if (filp-»f flags &O NONBLOCK) | /* 如 果 是 非 阻 塞 访问 */ 
4 ret —- - EAGAIN; 

9 goto out; 

6 j 

7 | Set current state(TASK INTERRUPTIBLE); /* 改 变 进程 状态 为 睡眠 */ 
8 up(&dev->sem); 

9 

20 schedule(); /* 调 度 其 他 进程 执行 */ 

gu if (signal pending(current)) { /* 如 果 是 因为 信号 唤醒 */ 
29 ret = - ERESTARTSYS; 

23 goto out2; 

24 ) 

25 

26 down(&dev-»sem); /* 获 得 信号 量 */ 

27 ) 

28 











29 ”/* 从 用 户 空 间 拷贝 到 内 核 空间 */ 

30 if (count > GLOBALEIFO SIZE - dev-»current len) 

sul count = GLOBALFIFO SIZE - dev-»current len; 

22 

33 if (copy from user (dev->mem + dev->current_len, buf, count)) { 
34 ret - - EFAULT; 





25 goto out; 

3$. Jj else i 

P dev-»current len += count; 

38 printk(KERN INFO "written $d bytes(s),current len:$dWn", count, dev 
29 -»current len); 

40 

41 wake up interruptible(&dev-»r wait); /* 唤 醒 读 等 待 队 列 */ 
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42 /* 产生 异步 读 信号 */ 

43 if (dev->async queue) 

44 kill fasync(&dev->async queue, SIGIO, POLL IN); 
45 

46 ret = count; 

47 } 

48 

49 out: up(&dev->sem); /* 释放 信号 量 */ 





50  out2:remove wait queue(&dev-»w wait, &wait); 
Sil set current state (TASK RUNNING); 

52 return ret; 

Sor 


参考 代码 清单 9.6， 增 加 异步 通知 后 的 globalfifo 设备 驱动 的 release() 函数 中 需 调用 
globalfifo_fasync() 函 数 将 文件 从 异步 通知 列表 中 删除 ， 代 码 清单 9.10 给 出 了 支持 异步 通知 的 
globalfifo_release() 函 数 。 




























































































代码 清单 9.10 ”增加 异步 通知 后 的 globalfifo 设备 驱动 release() 函 数 


1 int globalfifo release(struct inode *inode, struct file *filp) 
DIET 

3 /* 将 文件 从 异步 通知 列表 中 删除 */ 

4 globalfifo fasync( - 1, filp, 0); 

5 return 0; 

9$: 


9.3.2 ”在 用 户 空间 验证 globalfifo 的 异步 通知 
现在 ， 我 们 可 以 采用 与 代码 清单 9.2 类 似 的 方法 ,编写 一 个 在 用 户 空间 验证 globalfifo 异步 通 
知 的 程序 ， 这 个 程序 在 接收 到 由 globalfifo 发 出 的 信号 后 将 输出 信号 值 ， 如 代码 清单 9.11 所 示 。 


代码 清单 9.11 监控 globalfifo 异步 通知 信号 的 应 用 程序 


Tu uen s 




































































































































































/* 接 收 到 异步 读 信号 后 的 动作 */ 
void input handler(int signum) 


{ 





printf("receive a signal from globalfifo,signalnum:$dMn",signum); 


AO. OO JU UD oso Bio ge 


main () 
( 
sia atio, oW lebey 

fd = open("/dev/globalfifo", O RDWR, S IRUSR | S IWUSR); 

Jia am eni 

/* 启动 信号 驱动 机 制 */ 
signal (SIGIO, input handler); 
fcntl(fd, F SETOWN, getpid()); 
Glee = mewe td, EEGEDLEBR) 
fontlifg, ESETEM oflags RASENE 
while(1) { 

20 Sleep(100); 

zu } 

22 } else { 





r1 


/* ib input handler () &h38 srGro fd */ 


OO 





«o 
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IS printf("device open failureWMn"); 
24 } 
20) 


/home/lihacker/develop/svn/1dd6410-read-only/training/kernel/drivers/globalfifo/cho 包含 了 支持 
异步 通知 的 globalfifo 驱动 以 及 代码 清单 9.11 对 应 的 globalfifo_test.c 测试 程序 ， 在 该 目录 运行 make 


将 得 到 globalfifo.ko 和 globalfifo test: 
lihacker@lihacker-laptop: ~ /develop/svn/ldd6410-read-only/training/kernel/drivers/ 
globalfifo/ch9$ make 

make -C /lib/modules/2.6.28-11-generic/build M-/home/lihacker/develop/svn/l1dd6410- 
read-only/training/kernel/drivers/globalfifo/ch9 modules 


















































make[1]: Entering directory "^/usr/src/linux-headers-2.6.28-11-generic' 
CC [M] /home/lihacker/develop/svn/ldd6410-read-only/training/kernel/drivers/globalfifo/ 
ch9/globalfifo.o 
Building modules, stage 2. 
MODPOST modules 
CE /home/lihacker/develop/svn/ldd6410-read-only/training/kernel/drivers/globalfifo/ 
ch9/globalfifo.mod.o 
LD [M] /home/lihacker/develop/svn/ldd6410-read-only/training/kernel/drivers/globalfifo/ 
ch9/globalfifo.ko 
make[1]: Leaving directory '/usr/src/linux-headers-2.6.28-11-generic' 





gcc -o globalfifo test globalfifo test.c 


按照 与 8.3.2 节 相 同 的 方法 加 载 新 的 globalfifo 设备 驱动 并 创建 设备 文件 节点 , 运行 上 述 程序 ， 


通过 echo 癌 /dewglobalfifo 写 入 新 的 数据 时 ，input_handler() 将 会 被 调用 : 
root@lihacker-laptop:/home/lihacker/develop/svn/1dd6410-read-only/training/kernel/d 
rivers/globalfifo/ch9# ./globalfifo test& 

] 25251 























uk 



































rootülihacker-laptop:/home/lihacker/develop/svn/1dd6410-read-only/training/kernel/d 
rivers/globalfifo/ch9f echo 1 > /dev/globalfifo 
receive a signal from globalfifo,signalnum:29 


rootülihacker-laptop:/home/lihacker/develop/svn/1dd6410-read-only/training/kernel/d 
rivers/globalfifo/ch9f echo hello > /dev/globalfifo 
receive a signal from globalfifo,signalnum:29 


Linux 2.6 异步 1O 


9.4.1 AIO 概念 与 GNU C FRA 

Linux 中 最 常用 的 输入 /输出 (LOO 模型 是 同步 TO。 在 这 个 模型 中 ， 当 请 求 发 出 之 后 ， 应 用 
程序 就 会 阻塞 ， 直 到 请 求 满足 为 止 。 这 是 很 好 的 一 种 解决 方案 ， 因 为 调用 应 用 程序 在 等 待 IO 请 
求 完 成 时 不 需要 占用 CPU。 但 是 在 某 些 情况 中 ，IO 请 求 可 能 需要 与 其 他 进程 产生 交 老 。 可 移植 
操作 系统 接口 (POSIX) 异步 WO (CAIO) 应 用 程序 接口 CAPD 就 提供 了 这 种 功能 。 
Linux 异步 IO 是 2.6 版 本 内 核 的 一 个 标准 特性 ， 但 是 我 们 在 2.4 版 本 内 核 的 补丁 中 也 可 以 找 
到 它 。AIO 3x eR ERA VO 操作 ， 而 不 用 阻塞 或 等 待 任何 操作 完成 。 稍 后 或 在 
接收 到 IO 操作 完成 的 通知 时 ， 进 程 再 检索 VO 操作 的 结果 。 
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select() 函 数 所 提供 的 功能 (异步 阻塞 LOO 与 AIO 类 似 ， 它 对 通知 事件 进行 阻塞 ， 而 不 是 对 
VO 调用 进行 阻塞 。 

在 异步 非 阻 塞 LO 中 ， 我 们 可 以 同时 发 起 多 个 传输 操作 。 这 需要 每 个 传输 操作 都 有 惟一 的 上 
下 文 ， 这 样 才 能 在 它们 完成 时 区 分 到 底 是 哪个 传输 操作 完成 了 。 在 AIO 中 ， 通 过 aiocb CAIO IO 
Control Block) 结构 体 进行 区 分 。 这 个 结构 体 包含 了 有 关 传 输 的 所 有 信息 ， 以 及 为 数据 准备 的 用 
户 缓 冲 区 。 在 产生 IO 通知 〈 称 为 完成 ) 时 ，aiocb 结构 就 被 用 来 惟一 标识 所 完成 的 IO 操作 。 

AIO 系列 API 被 GNU C 库 函 数 所 包含 ， 它 被 POSIX.1b 所 要 求 ， 主 要 包括 如 下 函数 。 

1. aio read 

aio_read() 浮 数 请 求 对 一 个 有 效 的 文件 描述 符 进行 异步 读 操 作 。 这 个 文件 描述 符 可 以 表示 一 个 
文件 、 套 接 字 甚至 管道 。aio_read 函数 的 原型 如 下 : 

int aio read( struct aiocb *aiocbp ); 

aio_read0 函 数 在 请 求 进行 排队 之 后 会 立即 返回 。 如 果 执 行 成 功 ， 返 回 值 就 为 0; 如 果 出 现 错 
误 ， 返 回 值 就 为 -1， 并 设置 errno 的 值 。 

2. aio write 

aio_write(0) 函 数 用 来 请 求 一 个 异步 写 操 作 。 其 函数 原型 如 下 : 


ime cui wacitce( Gu cuoco veo ) 






































































































































































































































































































































































































































aio_wWrite0 函 数 会 立即 返回 ， 说 明 请 求 已 经 进行 排队 《成 功 时 返回 值 为 0， 失败 时 返回 值 为 -1， 
并 相应 地 设置 errno。 
3. aio error 











aio_error(0) 函 数 被 用 来 确定 请 求 的 状态 。 其 原型 如 下 : 

int aio error( struct aiocb *aiocbp ); 

这 个 函数 可 以 返回 以 下 内 容 。 

EINPROGRESS: 说 明 请 求 尚未 完成 。 

ECANCELLED: 说 明 请 求 被 应 用 程序 取消 了 。 

-1: 说 明 发 生 了 错误 ， 具 体 错误 原因 由 ermo 记录 。 

4. aio return 

异步 VO 和 标准 UO 方式 之 间 的 另外 一 个 区 别 是 不 能 立即 访问 这 个 函数 的 返回 状态 ， 因 为 异 
步 VO 并 没有 阻塞 在 read0 调 用 上 。 在 标准 的 read0 调 用 中 ， 返 回 状态 是 在 该 函数 返回 时 提供 的 。 
但 是 在 异步 WO 中 ， 我 们 要 使 用 aio_return0 函 数 。 这 个 函数 的 原型 如 下 : 

ssize t aio return( struct aiocb *aiocbp ); 
只 有 在 aio_error0) 调 用 确定 请 求 已 经 完成 (可 能 成 功 ， 也 可 能 发 生 了 错误 ) 之 后 ， 才 会 调用 
这 个 函数 。aio_return() 的 返回 值 就 等 价 于 同步 情况 中 read 或 write 系统 调用 的 返回 值 〈 所 传输 的 
字 节 数 ， 如 果 发 生 错 误 ， 返 回 值 为 负数 )。 

代码 清单 9.12 给 出 了 用 户 空 间 应 用 程序 进行 异步 读 操 作 的 一 个 例 程 ， 它 首先 打开 文件 ， 然 后 准 
备 aiocb 结构 体 ， 之 后 调用 aio_read(&my_aiocb) 进 行 提出 异步 读 请 求 ， 当 aio error(&my aiocb) == 
EINPROGRESS 即 操作 还 在 进行 中 时 ， 等 待 ， 结 束 后 通过 aio_return(&my aiocb) 获 得 返回 值 。 
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代码 清单 9.12 ”用 户 空 间 异 步 读 例 程 
1 #include <aio.h> 
2 
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3bare EG 
struct alocb my 410957 


rety; 


fd = open("file.txt", O RDONLY); 
ar (el O) 
perror ("open"); 


W 0 -10 0 4 € 


/* 清 零 aiocb 结构 体 */ 


bzero((char*) &my aiocb, 


0 

JL 

2 

3 /* Jy aiocb 请 求 分 配 数据 缓冲 区 */ 

4 my aiocb.aio buf - malloc(BUFSIZE -* 1); 
5 

6 

ji 

8 





if (imy aiocb.aloó but) 
joxesesetoae (Corel TMioxel e) B 


/* 初始 化 aiocb 的 成 员 */ 
9 my aiocb.aio fildes - fd; 
20 my aiocb.aio nbytes = BUFSIZE; 
21 my aiocb.aio offset - O0; 
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sizeof(struct aiocb)); 


22 

23 ret = aio read(&my aiocb); 

uA iUe 0 

23 perror("aio read"); 

26 

27 while (aio error(&my aiocb) == EINPROGRESS) 
28 continue; 

29 

30 Xf (iret — ato returnismy 1ocb)) ^ 0) 1 
31 /* 获得 异步 读 的 返回 值 */ 

32 } else { 

33 /* E 4MPperrorno */ 

34 ] 


5. aio suspend 









































用 户 可 以 使 用 aio_suspend() 函 数 来 挂 起 (或 阻塞 ) 调用 进程 ， 直 到 异步 请 求 完 成 为 止 ， 此 时 




















i 























个 信号 ， 或 者 发 生 其 他 超时 操作 。 调 ) 




















j 者 提供 了 


个 aiocb 引用 列表 ， 其 





任何 一 个 完 








ex). Es 

















成 都 会 导致 aio_suspend0 返 回 。aio_suspend 的 函数 原型 如 下 : 


int aio suspend( const struct aiocb *const cblist[], 



































const struct timespec *timeout ); 

















] aio_suspend() 函 数 的 例子 。 





代码 清单 9.13 ”用 户 空 间 异 步 |/O aio. suspend() 函 数 使 用 例 程 





Ee 
代码 清单 9.13 给 出 了 用 户 空间 异步 读 操 作 时 使 
eve cioe "(elu US S] 
2 /* WF aioct 结构 体 链表 */ 
3 zero wohar *"veblbsti Srze0i (eblise) J> 
4 /* 将 一 个 或 更 多 的 aiocb UN aioct 结构 体 链表 */ 
5 cblist[0] » &my aiocb; 
6 ret = aio read( &my aiocb ); 


7 ret = aio suspend( cblist, MAX LIST, NULL 


6. aio cancel 





); 








aio_cancel0) 函 数 允 许 用 户 取 消 对 某 个 文件 描述 符 执行 的 一 个 或 所 有 IO 请 求 。 其 原型 如 下 : 
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要 取消 一 个 请 求 ，} 

















户 需 提供 文件 


描述 符 和 aiocb 指针 。 如 果 这 





个 函数 就 会 返回 
要 取 

















肖 对 茶 个 给 











定 文 件 描述 符 的 所 有 请 求 ， 





Af 





AIO_CANCELED。 如 果 请 求 完成 了 ， 这 个 函数 就 
j 户 需要 提供 
































数 设置 为 NULL。 如 果 所 有 的 请 求 都 取消 了 ， 这 个 函数 就 会 
































一 个 请 求 没有 被 取消 ， 那 么 这 个 函数 就 会 返 世 




















AIO NOT CANCELED; 如 果 没 有 























这 个 文件 的 描述 符 ， 





个 请 求 被 成 功 取消 了 ， 那 么 这 
会 返回 AIO NOTCANCELED. 


并 将 aiocbp 参 

















返回 AIO CANCELED; 如 果 至 少 有 



































被 取消 ， 那 么 这 个 函数 就 会 返回 











AIO ALLDONE。 然 后 ， 








可 以 














个 请 求 可 以 








用 aio error()2 JS il 


HB 


F 每 个 AIO 请 
































求 ， 如 果 某 请 求 已 经 被 取消 了 ， 
T. lio listio 











那么 aio_error0 就 会 返 


























lio_listio0 函 数 可 用 
] 《一 次 内 核 上 下 文 切换 ) : 












































都 完成 为 止 。 在 操作 进行 排队 2 





























代码 清单 9.14 给 出 了 用 户 空间 异 
代码 清单 9. 14 用 户 空 






























































应 该 使 用 LIO WRITE 作为 操作 码 ， 而 LIO_ NOP 意味 着 空 





[H]-1, 并 


于 同时 发 起 多 个 传输 。 这 个 函数 非常 重要 ， 它 使 得 
启动 大 量 的 IO 操作 。lio_ listio API K 


ime lig liscio imi noce, Stive ioco siisi- me nent SCout 


mode 参数 可 以 是 LIO_WAIT z& LIO NOWAIT. LIO WAIT 会 阻塞 这 个 调用 
后 ，LIO NOWAIT 就 会 返回 。 
元 素 的 个 数 是 由 nent 定义 的 。 如 果 list HIRA NULL, lio listio() 24H 
步 VO 操作 时 使 用 lio_listio0 函 数 的 





s 间 异步 VO lio listio() 函 


T struct. aocbTadocp aoc52 

2 struct aiocb *list[MAX LIST]; 

Ur 

4 /* 准备 第 一 个 aiocb */ 

5 aiocbl.aio fildes - fd; 

6 aiocbl.ario buf.- malloc( BUPSIZE-lI e 

7 aiocbl.aio nbytes = BUFSIZE; 

8 aiocbl.aio offset - next offset; 

9 aiocbl.aio lio opcode = LIO READ; /* 异 步 读 操 作 */ 
O /* 准 备 多 个 aiocb */ 

p brer (Cher Tie sizeof (iita Jp 

2 

3 /# 将 aiocb 填 入 链表 */ 

4 list[0] -» &aiocbl; 

5 Ixst[i]| e $&2s106b2; 

[neis 

7 ret - lio listio( LIO WAIT, list, MAX LIST, NULL 
上 述 代码 第 9 行 ! 


xj 



































AIO 库 函 数 的 详细 信息 。 


9.4.2 ”使 用 信号 作为 AIO 的 通知 






























































函数 的 原型 如 下 : 


j 户 可 以 在 一 个 


ermo 会 被 设置 为 ECANCELED。 


系统 调 


Sigevent *sig ); 


























， 直 到 所 有 的 IO 























个 aiocb 引 
忽略 。 
列子 。 


数 使 用 例 程 


list 是 一 














用 的 列表 ， 最 大 


) ; /* 发 起 大 量 1/0 操作 */ 


作 。 














， 因 为 是 进行 异步 读 操 作 ， 所 以 操作 码 为 LIO_READ， 对 于 写 操作 来 说 ， 


使 
网 页 http://www.gnu.org/software/libc/manual/html node/Asynchronous-I 002fO.html 包含 了 


















































































































































































































































9.1 一 9.3 节 讲 述 的 信号 作为 异步 通知 的 机 制 在 ATO 中 仍然 是 适用 的 ， 为 使 用 信号 ， 使 用 AIO 
的 应 用 程序 同样 需要 定义 信号 处 理 程序 ， 在 指定 的 信号 被 产生 时 会 触发 调用 这 个 处 理 程序 。 作 为 
信号 上 下 文 的 一 部 分 ， 特 定 的 aiocb 请 求 被 提供 给 信号 处 理 函 数 用 来 区 分 AIO 请 求 。 

代码 清单 9.15 给 出 了 使 用 信号 作为 AIO 异步 IO 通知 机 制 的 例子 。 
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代码 清单 9.15 ”使 用 信号 作为 AlO 异步 I/O 通知 机 制 例 程 
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UP 1/0 Wbk*/ 





void setup io...) 

( 
int fd; 
heute ee ven sto osTS wor 
struct aoco my aloni: 


/* 设置 信号 处 理 函 数 */ 
sigemptyset(&sig act.sa mask); 
SA SIGINFO; 
sig act.sa sigactionm - 





Sig act.sa flags - 


/* 设置 AIO 请 求 */ 


aio completion handler; 


bzero((char*) 


&my aiocb, 


Siseof(atruct aiocbj)); 


my aioc 
my aioc 
my aioc 
my aioc 


b.aio fildes 
b.aio buf - 
b.aio nbytes 
b.aio offset 


fd; 


BUF SIZE; 
next offset; 


massulocc BURRS TA mes 


/* 连接 AIO 请 求 和 信号 处 理 函 数 */ 
my aiocb.aio sigevent.sigev notify - 
my aiocb.aio sigevent.sigev signo - 





/* 将 信号 与 信号 处 理 函 数 绑 定 */ 


SIGEV SIGNAL; 


STOLI? 
my_aiocb.aio_sigevent.sigev_value.sival_ptr = 


&my aiocb; 


ret — sigaction(SIGIO, &sig act, NULL)? 
ret = aio read(&my aiocb); /* 发 出 异步 读 请 求 */ 
} 
/* 信 号 处 理 函数 */ 


void aio completion handler(int signo, 
( 


struct aiocb *reqg; 





/* 确定 是 我 们 需要 的 信号 */ 
Te >SIsiono = BSIGIOY) 4 
req = 


/* 请 求 的 操作 完成 了 吗 ? */ 
if (aio error(req) == 0) { 
/* 请 求 的 操作 完成 ， 获 取 返 回 值 */ 


retis 














aio return (req); 




















(struct aiocb*)info-»si value.sival ptr; 


Sno fio on eon 


/* 获 得 aiocb*/ 


特别 要 注意 上 述 代码 的 第 38 行 通过 (struct aiocb*)info->si value.sival ptr 获得 了 信号 对 应 
的 aiocb。 


9.4.3 ”使 用 回调 画 数 作为 AIO 的 通知 


除了 信号 之 外 ， 应 


















































程序 还 可 提供 一 个 回调 (Callback〉 函数 给 内 核 ， 以 便 AIO 的 请 求 完成 
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后 内 核 调用 这 个 函数 。 
代码 清单 9.16 给 出 了 使 用 
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调 函 数 作为 AIO 异步 IO 请 求 完成 的 通知 机 制 的 例子 。 
代码 清单 9.16 ”使 用 回调 函数 作为 AIO 异步 I/O 通知 机 制 例 程 






































/* 设 置 异步 1/0 请 求 */ 


void setup 1907.5) 


Btrüct diocb. my alocb; 


/* 设置 AIO 请 求 */ 

bzero((char*) &my aiocb, sizeof(struct aiocb)); 
my aiocb.aio fildes = fd; 

my aiocp.aio buf — malloc(BUP STA2RÀ - Tys 

my aiocb.aio nbytes - BUF SIZE; 

my aiocb.aio offset - next offset; 





/* 连接 AIO 请 求 和 线程 回调 函数 * 
my aiocb.aio sigevent.sigev notify = SIGEV THREAD; 











my aiocb.aio sigevent.notify function = aio completion handler; 
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调 函 数 */ 
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9 
20 
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上 述 程 序 在 创建 aiocb 请 求 之 后 ， 使 用 SIGEV_THREAD 请 求 了 一 个 线程 回调 函数 来 作为 通 
知 方法 。 在 回调 函数 中 ， 通 过 (struct aiocb*)sigval.sival ptr 可 以 获得 对 应 的 aiocb 指针 ， 使 用 AIO 


my aiocb.aio sigevent.notify attributes = NULL; 





my aiocb.aio sigevent.sigev value.sival ptr = &my aiocb; 


21 ret = aio read(&my aiocb); /* Xj AIO iBok*/ 





24 /* 异步 I/0 完成 回调 函数 * 


25 void aio completion handler(sigval t sigval) 


























268 

27 struct aiocb *req; 

28 req = (struct aiocb*)sigval.sival ptr; 
29 

30 /* AIO 请 求 完 成 2 */ 

3 if (aio error(req) == 0) 

32 /* 请 求 完 成 ， 获 得 返回 值 */ 

a3 ret = aio return(reg); 

S4 


































































































函数 可 验证 请 求 是 否 已 经 完成 。 


























proc 文件 系统 包含 了 两 个 虚拟 文件 ， 它 们 可 以 用 来 对 异步 IO 的 性 能 进行 优化 。 
C1) /proc/sys/fs/aio-nr 文件 提供 了 系统 范围 异步 VO 请 求 现 在 的 数目 。 
(2) /proc/sys/fs/aio-max-nr 文件 是 所 允许 的 并 发 请 求 的 最 大 个 数 ， 最 大 个 数 通常 是 64KB， 这 








































































































对 于 大 部 分 应 用 程序 来 说 都 已 经 足够 了 。 


9.4.4 AIO 与 设备 驱动 
在 内 核 中 ， 每 个 IO 请 求 都 对 应 于 一 个 kiocb 结构 体 ， 其 ki_filp 成 员 指 向 对 应 的 file 指针 ， 
通过 is_sync_kiocb0 可 以 判断 某 kiocb 是 否 为 同步 VO 请 求 ， 如 果 返 回 非 真 ， 表 示 为 异步 IO 请 求 。 
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JER 
只 有 

















块 设备 和 网 络 设备 本 身 是 异步 的 
字符 设备 而 言 都 不 是 必须 的 ， 只 有 
时 候 使 用 异步 IO 将 可 改善 性 能 。 
































E ^E TE UC D? 21 8] 
极 少数 设备 需要 。 比 如 ， 对 于 磁带 机 ， 
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表明 应 支持 AIO。AIO 对 于 大 多 数 











于 VO 操作 很 慢 ， 这 

















字符 设备 驱动 程序 中 ，file_operations 包含 3 个 与 AIO 相关 的 成 员 函 数 : 








(*aio read) 
Ibo REMO fuf set 
(*aio write) 
lof orfeet 

(Bntruet kigo ees, 


ssize_t 
Size t count. 
ssize t 
size t count, 


int (*aio fsync) 


(res Te Troc 


(venue oe EC 


Shame eve 


GODS du ue 


int datasync); 














aio read0 和 aio write() 与 file operations ! 


, 而 后 


II 








递 人 


























首 传 递 的 是 指针 ， 这 是 因为 AIO 从 来 不 需要 改变 文件 的 


的 read0 和 writeO 中 


fer, 























的 offset 参数 不 同 ， 它 直接 传 














位 置 。 








aio_read0 和 aio_write0 函 数 本 身 不 一 定 完成 了 读 和 写 操作 ， 它 只 是 发 起 、 初 始 化 读 和 写 操作 ， 


























代码 清单 9.17 给 出 了 驱动 程序 ! 
代码 清单 9.17 


Btruct async work 4 



































aio read0 和 aio_writeO 函 数 的 实现 例子 。 


设备 驱动 中 的 异步 VO 函数 


sicect count; berff t 


chou Su MES ut NECS, 


2 struct kiocb *iocb; /* kiocb 结构 体 指针 */ 

3 int result; /* 执 行 结果 */ 

4 struct work struct work; /* 工作 结构 体 */ 

5 37 

GENE 

7 /* 异 步 读 */ 

b ot Seize x d ombeac et oe oco eh E, 
9 pos) 

9 1 

JL return xxx defer op(0, iocb, buf, count, pos); 

2 

B 

4 /* 异 步 写 */ 

5 static ssize t xxx aio write(struct kiocb *iocb, const 
6 doti e SOE) 

y oq 

8 return xxx defer op(1, iocb, (char*)buf, count, pos); 
en 
20 


21 /* 初 始 化 异步 I/0*/ 


22 Static int xxx defer op(int write, 



































struct kiocb *iocb, 


(loweus ^Jomu. eue t COSE 


28 deire e Y9X918)) 

24 {f 

IE) struct async work *async wk; 

26 int result: 

27 /* 当 我 们 能 访问 buffer 时 进行 copy */ 

28 if (write) 

29 result - xxx writelcocbeoeskl filp, but, dount. &posjc 
30 else 

2A IGSUlt = xxx read(locbsecki tilp, owne coust, ISE 
32 /* 如 果 是 同步 TOCB， 立 即 返回 状态 */ 

33 lf (1s syno ktocbtlocb)) 

34 return result; 

35 


36 /* 否则 ， 推 后 几 微 秒 执行 */ 
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37 async wk = kmalloc(sizeof(*async wk), GFP KERNEL); 
38 if (async wk == NULL) 

3/9) return result; 

40 /# 调 度 延 迟 的 工作 *7 

41 async wk-»iocb = iocb; 

42 demne wkecsresult = resulte 

43 INIT_WORK (&async_wk->work, xxx do deferred op, async wk); 
44 Schedule delayed work(&async wk-»work, Hz / 100); 
45 return - EIOCBQUEUED; /* 控 制 权 返 回 用 户 空 间 */ 

46 } 

47 

48 /* 延 迟 后 执行 */ 

49 static void xxx do deferred op(void *p) 

50 i 

S Struct async work *async wk = (struct async work*)p; 
52 suc P SAI aO EM E U 

53 aio complete (async wk-»iocb, async wk-»result, 0); 
54 kfree(async wk); 

SS 


















































上 述 代码 中 最 核心 的 是 使 用 work. struct 机 制 通过 schedule delayed_workO 函 数 将 IO 操作 延 
行 ， 而 在 具体 的 IO 操作 执行 完成 后 ，53 行 调 用 aio_complete0 通 知 内 核 驱 动 程序 已 经 完成 了 
SE. 
通常 而 言 ， 具 体 的 字符 设备 驱动 一 般 不 需要 实现 AIO 支持 ， 而 内 核 中 仅 有 fs/direct-io.c， 








































































































drivers/usb/gadget/inode.c、fs/nfs/direct.c 等 少量 地 方 使 用 了 AIO。 











他 操作 。 





























本 章 主要 讲述 了 Linux 中 的 异步 DO, 异步 UO 可 以 使 得 应 用 程序 在 等 待 1/O 操作 的 同时 进行 




































































使 用 信号 可 以 实现 设备 驱动 与 用 户 程 序 之 间 的 异步 通知 ， 总 体 而 言 ， 设 备 驱 动 和 用 户 空间 要 






























































分 别 完成 3 项 对 应 的 工作 ， 用 户 空间 设置 文件 的 拥有 者 、FASYNC 标志 及 捕获 信号 ， 内 核 空 间 响 
应 对 文件 的 拥有 者 、FASYNC 标志 的 设置 并 在 资源 可 获得 时 释放 信号 。 





























































































































Linux 2.6 内 核 包 含 对 AIO 的 支持 ， 它 为 用 户 空间 提供 了 统一 的 异步 IO 接口 。 在 AIO 中 ， 





















































和 回调 函数 是 实现 内 核 空间 对 用 户 空间 应 用 程序 通知 的 两 种 机 币 
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本 章 主 要 讲解 Linux 设备 驱动 编程 中 的 
服务 程序 的 执行 并 不 存在 于 进程 上 下 文 ， 因 此 ， 要 求 中 断 服务 程序 的 时 间 
尽 可 能 地 短 。 因 此 ，Linux 在 中 断 处 理 中 引入 了 项 半 部 和 底 半 部 分 离 的 机 
处 理 也 采用 中 断 方 式 ， 而 内 核 软 件 定时 器 最 终 























依赖 于 时 钟 中 断 。 





10.1 节 讲 解 中 断 和 定时 
10.2 节 讲 解 Linux ! 
10.3 节 讲 解 Linux ! 
断 以 及 中 断 底 半 部 tasklet, 1 














am 
EE 





10.4 节 讲 解 多 个 设备 共享 
10.5 节 和 10.6 
核 延 时 的 方法 。 





fl. 另外， 内 核 中 对 时 外 
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断 与 定时 器 处 理 。 由 于 中 断 

























































































器 的 概念 及 处 理 流 程 。 























断 处 理 








程序 的 架构 ， 顶 半 部 、 底 半 部 之 间 的 关系 。 


























Sm 


HZ 
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编程 的 方法 ， 涉 及 申 
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[ 作 队 列 、 软 中 断 机 制 。 
同一 个 中 断 号 时 的 中 断 处 理 过 程 。 


请 和 释放 中 断 、 禁 止 和 使 
































fE Linux i && Jh zJ]2 




















i 程 中 定时 器 的 编程 以 及 内 
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ION] «n 


所 谓 中 断 是 指 CPU 在 执行 程序 的 过 程 中 ， 出 现 了 茶 些 突 发 事件 急 待 处 理 ，CPU 必须 暂停 执 
行当 前 的 程序 ， 转 去 处 理 突 发 事件 ， 处 理 完毕 后 CPU 又 返回 原 程序 被 中 断 的 位 置 并 继续 执行 。 
根据 中 断 的 来 源 ， 中 断 可 分 为 内 部 中 断 和 外 部 中 断 ， 内 部 中 断 的 中 断 源 来 自 CPU 内 部 (软件 
中 断 指 令 、 滋 出 、 除 法 错误 等 ， 例 如 ， 操 作 系统 从 用 户 态 切换 到 内 核 态 需 借 助 CPU 内 部 的 软件 中 
fF)， 外 部 中 断 的 中 断 源 来 自 CPU 外 部 ， 由 外 设 提出 请 求 。 
根据 中 断 是 否 可 以 屏蔽 分 为 可 屏蔽 中 断 与 不 屏蔽 中 断 (NMI)， 可 屏蔽 中 断 可 以 通过 屏蔽 字 被 
屏蔽 ， 屏 贡 后 ， 该 中 断 不 再 得 到 响应 ， 而 不 屏蔽 中 断 不 能 被 屏蔽 。 
根据 中 断 入 口 跳 转 方法 的 不 同 ， 分 为 向 量 中 断 和 非 癌 量 中 断 。 采 用 向 量 中 断 的 CPU 通常 为 不 
同 的 中 断 分 配 不 同 的 中 断 号 ， 当 检测 到 某 中 断 号 的 中 断 到 来 后 ， 就 自动 跳 转 到 与 该 中 断 号 对 应 的 
地 址 执行 。 不 同 中 断 号 的 中 断 有 不 同 的 入 口 地 址 。 非 向 量 中 断 的 多 个 中 断 共 享 一 个 入 口 地 址 ， 进 
入 该 入 口 地 址 后 再 通过 软件 判断 中 断 标志 来 识别 具体 是 哪个 中 断 。 也 就 是 说 ， 向 量 中 断 由 硬件 提 
供 中 断 服务 程序 入 口 地 址 ， 非 向 量 中 断 由 软件 提供 中 断 服务 程序 入 口 地址 。 
个 典型 的 非 向 量 中 断 服务 程序 如 代码 清单 10.1 所 示 ， 它 先 判断 中 断 源 ， 然 后 调用 不 同 中 断 
源 的 中 断 服务 程序 。 
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代码 清单 10.1. 非 向 量 中 断 服 务 程序 典型 结构 
irq handler () 
{ 


int int src = read int status (); /# 读 硬件 的 中 断 相 关 寄 存 器 */ 
switch (int src) {/* 判 断 中 断 源 */ 
case DEV A: 





dev a handler(); 
break; 

case DEV B: 
dev b handier(); 


oreak; 


Ke» OD co Ot wee EO A 


default: 


oreak; 








ON oY BOO de C3 


} 
嵌入 式 系 统 以 及 X86 PC 中 大 多 包含 可 编程 中 断 控 制 器 (PIC), 许多 MCU 内 部 就 集成 了 PIC. 
如 在 80386 F, PIC 是 两 片 i8259A 芯片 的 级 联 。 通 过 读 写 PIC 的 寄存 器 ， 程 序 员 可 以 屏蔽 /使 能 
某 中 断 及 获得 中 断 状态 ， 前 者 一 般 通 过 中 断 MASK 寄存 器 完成 ， 后 者 一 般 通 过 中 断 PEND 寄存 器 
完成 。 














































































































定时 器 在 人 硬件 上 也 依赖 中 断 来 实现 ， 图 10.1 所 示 为 典型 的 谍 入 式微 处 理 内 可 编程 间隔 定 
时 器 PIT) 的 工作 原理 ， 它 接收 一 个 时 钟 输入 ， 当 时 钟 脉冲 到 来 时 ， 将 目前 计数 值 增 1 并 与 
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预先 设置 








的 计数 值 ( 











前 计数 值 。 





设备 的 中 断 会 打 断 内 核 ， 


一 一 时 钟 输入 


计数 





目标 ) 比较 ， 若 相等 ， 订 


























务 程 
当中 
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为 了 在 








尽 可 能 
断 到 来 时 ， 
图 10.2 描述 了 Linux 内 核 的 中 出 


量 工作 之 间 








断 执 行 时 间 





程序 分 解 为 两 个 半 部 : 
部 (bottom half). 





顶 半 部 完成 
往 只 是 简单 地 读 取 寄 存 器 中 

















现在 ， 
半 部 几乎 做 了 ， 





的 短小 精怪 。 但 是 ， 


HERK TEY 











进程 的 了 
这 个 
FE 往 并 不 会 是 短小 的 ， 


目前 计数 值 
(时 钟 脉冲 到 来 时 ， 增 1) 





EE 1: 


图 10.1 定时 器 工作 原理 


Linux 中 断 处 理 程序 架构 


中 断 与 时 钟 





E 明 计数 周期 满 ， 产 生 定时 器 


NEL 














断 并 复位 目 








输出 中 断 > 











处 理 
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尽 可 能 短 和 | 








顶 半 部 Ctop half) 和 底 半 











Wl 


找到 一 个 平衡 点 ，Linux 将 


民 可 能 少 的 比较 紧急 的 功能 ， 它 往 


处 E rin 完成 
Ir kb XE 
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BRAJ 
Wr" 的 工作 。 “登记 中 断 ” 意 
将 底 半 部 处 理 程序 挂 到 该 设备 的 底 半 部 执行 队 


列 中 去 。 这 样 ， 顶 半 部 执行 的 速度 就 会 很 快 ， 
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大 不 同 ， 


较 耗 时 ， 不 在 硬件 中 大 
尽管 顶 半 部 、 底 半 





的 中 断 处 理 一 定 要 分 两 
顶 半 部 全 部 完成 。 
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为 顶 半 部 往 























的 结合 能 





























的 重心 就 落 在 了 底 





E 常 调度 和 和 运行， 系统 对 更 高 吞 中 
恨 好 的 愿望 往生 




















可 以 服务 更 多 的 ， 
部 的 头 上 ， 


一 一 中 断 














F 率 的 追求 势必 要 求 中 断 服 
与 现实 并 不 吻合 。 在 大 多 数 真 实 的 系统 中 ， 
它 可 能 要 进行 较 大 量 的 耗 时 处 理 。 



































(紧急 的 硬件 操作 ) 





上 半 部 








ESAE 
半 部 


(延缓 的 耗 时 操作 ) 









































里 程序 所 有 的 事情 ， 而 且 避 
往 被 设计 成 不 可 中 断 。 底 半 部 则 相对 
务 程序 中 执行 。 
够 改善 系统 的 响应 能 力 ， 但 是 ， 便 
个 半 部 则 是 不 对 的 。 如 果 






























































一 -一 -一 一 一 一 一 一 一 一 一 -一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 -一 一 一 一 一 一 一 一 一 一 一 一 





断 请 求 。 


它 来 完成 中 断 事件 的 绝 大 多 数 
以 被 新 的 ! 











图 10.2 Linux 中 断 处 理 机 制 


任务 。 底 





断 打 断 ， 这 也 是 底 半 部 和 顶 半 部 的 最 
来 说 并 不 是 非常 紧急 的 ， 而 且 相 对 比 


化 地 认为 Linux 设备 驱动 中 
的 工作 本 身 很 少 ， 











则 完全 可 以 直接 在 























都 应 该 尽 可 能 短 。 因 此 ， 许 多 操作 系统 都 提供 了 中 断 上 下 文 和 非 中 断 上 下 文 相 结合 的 机 制 ， 
将 中 断 的 耗 时 工作 保留 到 非 中 断 上 下 文 去 执行 。 例 如 ， 在 VxWorks 中 ， 网络 设 备 包 接收 中 断 
到 来 后 ,中断 服 务 程 序 会 通过 netobAdd(0) 酌 数 将 耗 时 的 包 接 收 和 上 传 工 作 交 给 tNetTask 任务 


去 执行 。 
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在 Linux 中 , 查看 /proc/interrupts 文件 可 以 获得 
1 列 是 中 断 号 ， 第 2 列 是 向 CPUO 产生 该 中 断 的 次 数 ， 之 后 的 是 对 于 中 断 的 描述 。 
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1 0.3 Linux 中 断 编程 


10.3.1 


申请 和 释放 中 断 





系统 











BusLogic BT-958 














在 Linux 设备 驱动 中 ， 使 




















中 断 的 设备 需要 1 





request irq() 和 free irq() 函 数 。 
1. 申请 IRQ 











请 和 释放 对 应 的 中 断 ， 分 别 使 














int request irq(unsigned int irg, irq handler t handler, 


unsigned long irgflags, const char *devname, void *dev id) 














irq 是 要 申请 的 硬件 中 断 号 。 




















handler 是 向 系统 登记 的 ! 














这 个 函数 ，dev_id 参数 将 被 传递 























irqflags 是 中 断 处 




















断 处 理 函 数 《〈 顶 半 部 
给 它 。 
里 的 属性 ， 可 以 指定 ， 


断 的 触发 方式 以 及 处 j 








)， 是 一 个 回调 函数 ， 中 断 发 生 时 ， 系 统 调用 





























中 断 的 统计 信息 , 在 单 处 到 


器 的 系统 中 ， 




















j 内 核 提 供 的 























里 方式 。 在 触发 方式 方面 ， 可 以 是 


IRQF TRIGGER RISING. IRQF TRIGGER FALLING. IRQF TRIGGER HIGH. IRQF TRIGGER - 










































































































































































快 











LOW 等 。 在 处 理 方式 方面 ， 若 设置 了 IRQF _ DISABLED， 表 明 中 断 处 理 程序 是 快速 处 理 程序 ， 
速 处 理 程序 被 调用 时 屏蔽 所 有 中 断 ， 慢 速 处 理 程序 则 不 会 屏蔽 其 他 设备 的 驱动 ; 若 设 置 了 
IRQF _ SHARED， 则 表示 多 个 设备 共享 中 断 ，dev id 在 中 断 共享 时 会 用 到 ， 一 般 设 置 为 这 个 设备 




















的 设备 结构 体 或 者 NULL。 

















request irq()iR [n 





0 表示 成 功 ， 返 回 



































n 





断 已 经 被 占 





-EBUSY 表示 

















1H 88: 








E. 














顶 半 部 handler 的 类 型 irq. handler t 定义 为 : 


typedef irqreturn t 





typedef int irgreturn t; 


2. 释放 IRQ 


-EINVAL 表示 中 断 号 无 效 或 处 理 



































(人 


与 fequest irq0 相 对 应 的 函数 为 free _irq0，free irq0 的 原型 为 : 
void free irq(unsigned int irg,void *dev id); 


free_irq() 中 参数 的 定义 与 request_irq0 相 同 。 





函数 指针 为 NULL， 返 
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10.3.2 ”使 能 和 屏蔽 中 断 
F 列 3 个 函数 用 于 屏蔽 一 个 中 断 源 : 


void disable irq(int irq); 




















vord disable rg nosynco(int 2rqy. 

void enable irq(int irq); 

disable irq nosync()j disable irq0 的 区 别 在 于 前 者 立即 返回 ， 而 后 者 等 待 目前 的 中 断 处 理 完 
成 。 由 于 disable irq0 会 等 待 指定 的 中 断 被 处 理 完 ， 因 此 如 果 在 n 号 中 断 的 顶 半 部 调 
disable irqm， 会 引起 系统 的 死 锁 ， 这 种 情况 下 ， 只 能 调用 disable irq nosync(n). 


列 两 个 函数 〈 或 宏 ， 有 具体 实现 依赖 于 CPU 体系 结构 ) 将 屏蔽 本 CPU 内 的 所 有 中 断 : 


define local irq save(flags) 








































































































































































































vord locat irq disable(vord); 


前 者 会 将 目前 的 中 断 状态 保留 在 flags 中 注意 flags X unsigned long 类 型 ， 被 直接 传递 ， 而 
不 是 通过 指针 )， 后 者 直接 禁止 中 断 而 不 保存 状态 。 
与 上 述 两 个 禁止 中 断 对 应 的 恢复 中 断 的 函数 《或 宏 ) 是 : 

































































define local irq restore(flags) 
) 


( 
void local irq enable (void); 


以 上 各 local 开头 的 方法 的 1 
10.3.3 底 半 部 机 制 


Linux 实现 底 半 部 的 机 制 主要 有 tasklet、 工 作 队 列 和 软 中 断 。 
1. tasklet 
tasklet 的 使 用 较 简单 ， 我 们 只 需要 定义 tasklet 及 其 处 理 函 数 并 将 两 者 关联 ， 例 如 : 
void my tasklet func(unsigned long); /* 定 义 一 个 处 理 函 数 */ 


DECLARE TASKLET (my tasklet, my tasklet func, data); 
[9538 4 —-P tlie Ss wy telles S my taskler func(eata) ug v 


代码 DECLARE TASKLET(my tasklet,my tasklet func,data) 实 现 了 定义 名 称 为 my tasklet 的 
tasklet 并 将 其 与 my tasklet funcO 这 个 函数 绑 定 ， 而 传 入 这 个 函数 的 参数 为 data。 
在 需要 调度 tasklet 的 时 候 引 用 一 个 tasklet schedule0 函 数 就 能 使 系统 在 适当 的 时 候 进 行 调度 



































围 是 本 CPU 内 。 
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tasklet schedule(&my tasklet); 
使 用 tasklet ES JE AP BEI SI FT I E A CU CR IC RE. 10.2 所 示 ( 仅 包含 与 中 断 相 
关 的 部 分 )。 
















































































代码 清单 10.2 tasklet 使 用 模板 
/* 定 义 tasklet 和 底 半 部 函数 并 关联 */ 


void xxx do tasklet (unsigned long); 
DECLARE TASKLET (xxx tasklet, xxx do tasklet, 0); 











/* 中 断 处 理 底 半 部 */ 
void xxx do tasklet(unsigned long) 
{ 
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1 /* 中 断 处 理 项 半 部 */ 

2 irqreturn t xxx interrupt(int irq, void *dev id) 
E 

4 cop 

5  tasklet schedule(S$xxx tasklet); 

6 

Jg 

8 

9 /* 设 备 驱 动 模块 加 载 函数 */ 

20; nls ale Se nl (aene) 

PI 

22 efas 

23  /*Wnirler*/ 

24 result = request irq(xxx irg, xxx interrupt, 
25 IROF DISABLED, "xxx", NULL); 

C. uc 

2 return IRQ HANDLED; 

Zi 

DO 


30 /*Wis REI AREN EN AR HUS / 
31 void | exit xxx exit(void) 
S2. 4 





34 "Ep 


Sb cfyeo uLfgQUe Irgy Xxx LHCOeTIUDDO 

















上述 程序 在 模块 加 载 函 数 中 申请 中 断 (第 24—25 行 )， 并 在 模块 和 卸载 函数 中 释放 它 (第 35 
行 )。 对 应 于 xxx_irq 的 中 断 处 理 程序 被 设置 为 xxx_interrupt0) 函 数 ， 在 这 个 函数 中 ， 第 15 行 的 
tasklet_schedule(&xxx_tasklet) 调 度 被 定义 的 tasklet 函数 xxx_do_tasklet() 在 适当 的 时 候 得 到 执行 。 














































































































2. 工作 队列 

工作 队列 的 使 用 方法 和 tasklet 非常 相似 ， 下 面 的 代码 用 于 定义 一 个 工作 队列 和 一 个 底 半 部 执 
行 函数 : 

struct work struct my wq; /* 定 义 一 个 工作 队列 */ 











void my wq func(unsigned long); /* 定 义 一 个 处 理 函 数 */ 
通过 INIT_ WORKO 可 以 初始 化 这 个 工作 队列 并 将 工作 队列 与 处 理 函 数 绑 定 : 
NIT WORK(&my wq, (void (*)(void *)) my wq func, NULL); 
/* 初 始 化 工作 队列 并 将 其 与 处 理 函数 绑 定 */ 
与 tasklet_schedule() 对 应 的 用 于 调度 工作 队列 执行 的 函数 为 schedule work(), Ju: 
schedule work (&my_wq) ; /* 调 度 工作 队列 执行 */ 
与 代码 清单 10.2 对 应 的 使 用 工作 队列 处 理 中 断 底 半 部 的 设备 驱动 程序 模板 如 代码 清单 10.3 
所 示 〔 仪 包含 与 中 断 相关 的 部 分 )。 


代码 清单 10.3 ”工作 队列 使 用 模板 
/* 定 义工 作 队 列 和 关联 函数 */ 


struct work struct xxx wq; 



















































































































































































void xxx do work(unsigned long); 


/* 中 断 处 理 底 半 部 */ 


void xxx do work (unsigned long) 
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P 4 
8 
er gj 
0 
1 /* 中 断 处 理 顶 半 部 */ 
2 ne ne ne ee ol ve te T9, ee eega) 
S 
4 6758 
5 schedule work(&xxx wq); 
NE d 
lj return IRQ HANDLED; 
9 
8 
20 /* 设 备 驱动 模块 加 载 函 数 */ 
21 int xxx init (void) 
22 * 
2o 
24 ”/* 申 请 中 断 */ 
25 result = request irq(xxx irg, xxx interrupt, 
26 IROQF DISABLED, "xxx", NULL); 
P iere 
28 /* 初 始 化 工作 队列 */ 
29 INIT WORK(&xxx wq, (void (*)(void *)) xxx do work, NULL); 
S01 
Su 
32 


33 / RE REI AREN EN AER CS / 
34 void xxx exit (void) 
SON 


37 /* 释 放 中 断 */ 


局 


40 ) 
与 代码 清单 10.2 不 同 的 是 ， 上 述 程序 在 设计 驱动 模块 加 载 函 数 中 增加 了 初始 化 工作 队列 的 代 
码 (58 29 行 )。 
尽管 Linux 社区 多 建议 在 设备 第 一 次 打开 时 才 申 请 设备 的 中 断 并 在 最 后 一 次 关闭 时 释放 中 断 
以 尽量 减少 中 断 被 这 个 设备 占用 的 时 间 ， 但 是 ， 许 多 情况 下 ， 驱 动工 程 师 还 是 将 中 断 申 请 和 释放 
的 工作 放 在 了 设备 驱动 的 模块 加 载 和 伸 载 函 数 中 。 
3. 软 中 断 
软 中 断 〈softirq) 也 是 一 种 传统 的 底 半 部 处 理 机 制 ， 它 的 执行 时 机 通常 是 顶 半 部 返回 的 时 候 ， 
tasklet 是 基于 软 中 断 实现 的 ， 因 此 也 运行 于 软 中 断 上 下 文 。 
在 Linux 内 核 中 ， 用 softirq action 结构 体 表 征 一 个 软 中 断 ， 这 个 结构 体 中 包含 软 中 断 处 理 函 
数 指针 和 传递 给 该 函数 的 参数 。 使 用 open_softirq0 函 数 可 以 注册 软 中 断 对 应 的 处 理 函 数 ， 而 
raise_softirq() 函 数 可 以 触发 一 个 软 中 断 。 
软 中 断 和 tasklet 运行 于 软 中 断 上 下 文 ， 仍然 属 于 原子 上 下 文 的 一 种 ， 而 工作 队列 则 运行 于 进 
程 上 下 文 。 因 此 ， 软 中 断 和 tasklet 处 理 函 数 中 不 能 睡眠 ， 而 工作 队列 处 理 函 数 中 允许 睡眠 。 
local bh disable()fil local_bh_enable0 是 内 核 中 用 于 禁止 和 使 能 软 中 断 和 tasklet 底 半 部 机 制 的 函数 。 
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内 核 中 采用 softirq 的 地 方 包括 HI SOFTIRQ. TIMER SOFTIRQ. NET TX SOFTIRQ, NET - 
RX SOFTIRQ. SCSI SOFTIRQ. TASKLET SOFTIRQ 等 ， 一 般 来 说 ， 驱 动 的 编写 者 不 会 也 不 宜 
直接 使 用 softirq。 
第 9 章 异 步 通 知 所 基于 的 信号 也 类 似 于 中 断 ， 现 在 ， 总 结 一 下 硬 中 断 、 软 中 断 和 信和 号 的 区 别 : 
硬 中 断 是 外 部 设备 对 CPU 的 中 断 ， 软 中 断 是 中 断 底 半 部 的 一 种 处 理 机 制 ， 而 信号 则 是 由 内 核 (或 
他 进程 》 对 某 个 进程 的 中 断 。 在 论 及 系统 调用 的 场合 ， 人 们 也 常 说 通过 软 中 断 〈 例 如 ARM 为 
swi) 陷入 内 核 ， 此 时 软 中 断 的 概念 是 指 由 软件 指令 引发 的 中 断 ， 和 我 们 这 个 地 方 说 的 softirq 是 两 
个 完全 不 同 的 概念 。 


10.3.4 实例 : S3C6410 实时 钟 中 断 
S3C6410 处 理 器 内 部 集成 了 实时 钟 CRTC) 模块 ， 该 模块 能 够 在 系统 断 电 的 情况 下 由 后 备 电 
池 供 电 继续 工 作 ， 其 主要 功能 相对 于 一 个 时 钟 ， 记 录 年 、 月 、 日、 时、 分 、 秒 等 。S3C6410 的 RTC 
产生 两 种 中 断 : 周期 节拍 〈tick) 中 断 和 报警 Calarm) 中 断 ， 前 者 相当 于 一 个 周期 性 的 定时 器 ， 
目 当 于 一 个 “闹钟 ” 它 在 预先 设 定 的 时 间 到 来 时 产生 中 断 。 
S3C6410 实时 钟 设备 驱动 Cdrivers/rtc/rtc-s3c.c, 为 S3C2410、S3C64XX、S5PC1XX、S5P64XX 
多 种 CPU 共享 ) 的 open() 函 数 中 ， 会 申请 它 将 要 使 用 的 中 断 ， 如 代码 清单 10.4 所 示 。 


代码 清单 10.4 S3C6410 实时 钟 驱动 open() 函 数 
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1 static int s3c rtc open(struct device *dev) 
Z o4 
d struct platform device *pdev = to platform device (dev); 
4 Struct rtc device *rtc dev - platform get drvdata (pdev); 
5 int ret; 
6 /* 申 请 alarm 中 断 */ 
7 ret = request irq(s3c rtc alarmno, s3c rtc alarmirq, 
8 IRQF DISABLED, "s3c2410-rtc alarm", rtc dev); 
g 
0 d (Gee) 4 
i dev err(dev, "IRQ$d error d\n", s3c rtc alarmno, ret); 
2 return ret; 
SE 
4 
5  /*Wi tick 中 断 */ 
16 ret = request irq(s3c rtc tickno, s3c rtc tickirq, 
17 IRQF DISABLED,  "s3c2410-rtc tick", rtc dev); 
8 
9) Au (Gas) 4 
20 dev err(dev, "IRQ$d error d\n", s3c rtc tickno, ret); 
AA SOUto OKR eris 
2 EE 
23 
24 return ret; 
2D 


26 tick err: 

2 free irq(s3c rtc alarmno, rtc dev); 
28 return ret; 

2IORRI 
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中 断 与 时 钟 


举 放 它 将 要 使 用 的 中 断 ， 如 代码 清单 10.5 所 示 。 


代码 清单 10.5. S3C6410 实时 钟 驱动 release() 函 数 
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S3C6410 实时 钟 设备 驱动 的 release() 函 数 中 ， 会 ; 


i] 

















1 static void s3c rtc release(struct device *dev) 
2 1 
3 struct platform device *pdev - to platform device (dev); 
4 struct rtc device *rtc dev = platform get drvdata (pdev); 
5 
6 s3c_rtc_setpie (dev, 0); 
7 /* 释 放 中 断 */ 
8 free irq(s3c rtc alarmno, rtc dev); 
9 free irq(s3c rtc tickno, rto dev); 
0 



































S3C6410 实时 钟 驱动 的 中 断 处 理 比 较 简 单 ， 没 有 明确 地 分 为 上 下 两 个 半 部 ， 而 只 存在 项 半 部 ， 
如 代码 清单 10.6 所 示 。 


















































代码 清单 10.6 S3C6410 实时 钟 驱动 中 断 处 理 程序 


SEE 








Z 
3 struct rtc device *rdev - id; 
4 
8 rte update irgtrdevi. dy RBTCOAFP no 

6 
E: ssc rte set brt byte(sac Pto base,5302410 INTPSOGC2ZIQ0 INTE ALMys 
8 

9 return IRO HANDLED; 

0 y 

JL 

2 rye. ne [Sole sect eane dice. vol gl) 

3 d 

4 struct rtc device *rdev - id; 

5 

6 rto update irgtrdev d NTOSRE PORTO OPRORYXE 

Ji 

8 s3scorte set bit byre(53aoccrto bdsel2302410 INTP.SOGCOVIO INTP TICYS 
E 
20 return IRQ HANDLED; 
251 












































上 述 代码 中 调用 的 rte. update. irqOPA E XF drivers/rtc/interface.c 文件 中 , 被 各 种 实时 钟 
驱动 共享 ， 如 代码 清单 10.7 所 示 。 


代码 清单 10.7 ”实时 钟 更 新 rtc_update _irq() 函 数 























L Oe Een(S ue ev ee 

2 unsigned long num, unsigned long events) 

EET 

4 spim lockisrto-»irq Jock); 

3 rtc-»irq data - (rtc-»irq data * (num «« 8)) | events; 
6 spin unbockErte-osl1ipq Dock); 

jJ 

8 sois lok eo ire Lbask Locks 

3 abE (aegre user EESE) 

10 rte eo re rea ri tedata 
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T ship olnlockiwrte-c irg task el 

12 

13 wake up interruptible(&rtc-»irq queue); 

14 kill fasync(&rtc-»async queue, SIGIO, POLL IN); 
Toa: 




















上 述 中 断 处 理 程序 并 没有 底 半 部 〈 或 者 说 没有 严格 意义 上 的 tasklet、 工 作 队 列 或 软 中 断 底 半 
部 )， 实 际 上 ， 它 只 是 唤醒 一 个 等 待 队 列 rtc->irq_queue 并 发 出 一 个 SIGIO 信号 ， 而 这 个 等 待 队列 
的 唤醒 也 将 导致 一 个 阻塞 的 进程 被 执行 (这 个 阻塞 的 进程 可 看 作 底 半 部 )。 现 在 我 们 看 到 ， 等 待 队 
列 可 以 作为 中 断 处 理 程序 顶 半 部 和 进程 同步 的 一 种 良好 机 制 。 但 是 ， 任 何 情况 下 ， 都 不 能 在 顶 半 


部 等 待 一 个 等 待 队列 ， 而 只 能 唤醒 。 


中 断 共享 


多 个 设备 共享 一 根 硬 件 中 断 线 的 情况 在 实际 的 硬件 系统 中 广泛 存在 ，Linux 2.6 支持 这 种 

k 享 。 下 面 是 中 断 共享 的 使 用 方法 。 

(1) 共享 中 断 的 多 个 设备 在 申请 中 断 时 ， 都 应 该 使 用 IRQF SHARED 标志 ， 而 且 一 个 设备 以 

IRQF SHARED 申请 某 中 断 成 功 的 前 提 是 该 中 断 未 被 申请 ， 或 该 中 断 虽然 被 申请 了 ， 但 是 之 前 申 

请 该 中 断 的 所 有 设备 也 都 以 IRQF_SHARED 标志 申请 该 中 断 。 
(2) 尽管 内 核 模块 可 访问 的 全 局 地 址 都 可 以 作为 request_irq(.…， 
void *dev_id) 的 最 后 一 个 参数 dev id， 但 是 设备 结构 体 指 针 显 然 是 

可 传 入 的 最 佳 参数 。 

Y 
处 理 中 断 ， 调 度 下 半 部 
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(3) 在 中 断 到 来 时 ， 会 遍历 执行 共享 此 中 断 的 所 有 中 断 处 理 
程序 ， 直到 某 一 个 函数 返回 IRQ. HANDLED. 在 中 断 处 理 程序 顶 
半 部 中 ， 应 迅速 地 根据 硬件 寄存 器 中 的 信息 比照 传 入 的 dev. id 参 
数 判断 是 否 是 本 设备 的 中 断 ， 若 不 是 ， 应 迅速 返回 IRQ NONE, 
如 图 10.3 所 示 。 

代码 清单 10.8 给 出 了 使 用 共享 中 断 的 设备 驱动 程序 的 模板 图 10.3 共享 中 断 的 处 理 
( 仅 包 含 与 共享 中 断 机 制 相关 的 部 分 )。 


代码 清单 10.8 ”共享 中 断 编程 模板 

















































































































































































































/* 中 断 处 理 顶 半 部 */ 


irqreturn t xxx interrupt(int irg, void *dev id, struct pt regs *regs) 





int status = read int status ();/*3kAU Bj / 
if(!is myint(dev id,status)) /* 判 断 是 否 是 本 设备 中 断 */ 
return IRQ NONE; /* 不 是 本 设备 中 断 ， 立 即 返 回 */ 


me J (a ces (9 eov qe5 














I] 


/* 是 本 设备 中 断 ， 进 行 处 理 */ 


[En 
ce 


11 return IRQ HANDLED; /* 返回 IRQ HANDLED 表明 中 断 已 被 处 理 */ 
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ub LEE (D 


14 /* 设 备 驱 动 模块 加 载 函 数 */ 
US le (a el) 
16. 4 


eoo 


























18 ”/* 申 请 共享 中 断 */ 
19 result - request irq(sh irg, xxx interrupt, 
20 IRQF SHARED, "xxx", xxx dev); 





22 Y 


24 / R Ray AREN EN AR DIC / 
25 void xxx exit (void) 
DOMI 

28 /* 释 放 中 断 */ 


29! sEyoe Irg(xxx Prg, xxx Interrupt); 


1 0,5 内 核定 时 器 


10.5.1 内 核定 时 器 编程 
软件 意义 上 的 定时 器 最 终 依赖 硬件 定时 器 来 实现 ， 内 核 在 时 钟 中 断 发 生 后 执行 检测 各 定时 器 
是 否 到 期 ， 到 期 后 的 定时 器 处 理 函 数 将 作为 软 中 断 在 底 半 部 执行 。 实 质 上 ， 时 钟 中 断 处 理 程序 会 
唤起 TIMER_SOFTIRQ 软 中 断 ， 运 行当 前 处 理 器 上 到 期 的 所 有 定时 器 。 
在 Linux 设备 驱动 编程 中 ， 可 以 利用 Linux 内 核 中 提供 的 一 组 函数 和 数据 结构 来 完成 定时 触 
发 工作 或 者 完成 某 周 期 性 的 事务 。 这 组 函数 和 数据 结构 使 得 驱动 工程 师 多 数 情 况 下 不 用 关心 具体 
的 软件 定时 器 究竟 对 应 着 怎样 的 内 核 和 硬件 行为 。 
Linux 内 核 所 提供 的 用 于 操作 定时 器 的 数据 结构 和 函数 如 下 。 
1. timer list 
在 Linux 内 核 中 ，timer list 结构 体 的 一 个 实例 对 应 一 个 定时 器 ， 如 代码 清单 10.9 所 示 。 


代码 清单 10.9 timer list 结构 体 


















































































































































































































































































































































struct timer list í( 
struct list head entry; /* 定时 器 列表 */ 
unsigned long expires; /* 定 时 器 到 期 时 间 */ 
void (*function) (unsigned long); /* 定时 器 处 理 函 数 */ 
unsigned long data; /* 作为 参数 被 传 入 定时 器 处 理 函 数 */ 


JL 
2 
3 
4 
3) 
6 struct timer base s *base; 
Ji 
8 
MA 





); 

定时 器 期 满 后 ， 其 中 第 5 行 的 fpnction0) 成 员 将 被 执行 ， 而 第 4 行 的 data 成 员 则 是 传 入 其 中 
的 参数 ， 第 3 行 的 expires 则 是 定时 器 到 期 的 时 间 Gjiffies)。 
0 下 代码 定义 一 个 名 为 my timer 的 定时 器 : 


struct timer list my timer; 












































Yr 
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2. 初始 化 定时 器 

void init timer(struct timer list * timer); 

上 述 init timer() FK SU] 4815 timer. list 的 entry 的 next 为 NULL， 并 给 base 指针 赋值 。 
TIMER INITIALIZER( function，expires，data) 宏 用 于 赋值 定时 器 结构 体 的 function, expires. 

data 和 base 成 员 ， 这 个 宏 的 定义 为 ; 






































#define TIMER INITIALIZER( function, expires, data) ( N 
.entry = { .prev = TIMER ENTRY STATIC jJ, N 
.function = ( function), N 
.expires - ( expires), X 
.data = ( data), N 
.base = &boot tvec bases, N 


} 
DEFINE TIMER( name, function, expires，_data) 宏 是 定义 并 初始 化 定时 器 成 员 的 “快捷 
式 ” 这 个 宏 定 义 为 : 
#define DEFINE TIMER( name, function, expires, data) X 


struct timer_list _name = N 
TIMER INITIALIZER( function, expires, data) 


此 外 ，setup_timer0 也 可 用 于 初始 化 定时 器 并 赋值 其 成 员 ， 其 源 代码 为 : 


static inline void setup timer(struct timer list * timer, 





过 









































au 








void (*function) (unsigned long), 
unsigned long data) 


timer-»function - function; 
timer-»data = data; 


init timer(timer); 


3. 增加 定时 器 

void add timer(struct timer list * timer); 

上 述 函 数 用 于 注册 内 核定 时 器 ， 将 定时 器 加 入 到 内 核 动态 定时 器 链表 中 。 
4. 删除 定时 器 


int del timer(struct timer list * timer); 
上 述 函 数 用 于 删除 定时 器 。 
del timer sync() 是 del timer0 的 同步 版 ， 在 删除 一 个 定时 器 时 需 等 待 其 被 处 至 
数 的 调用 不 能 发 生 在 中 断 上 下 文 。 

5. 修改 定时 器 的 expire 

int mod timer(struct timer list *timer, unsigned long expires); 
上 述 函数 用 于 修改 定时 器 的 到 期 时 间 ， 在 新 的 被 传 入 的 expires 到 来 后 才 会 执行 定时 器 函数 。 
尺码 清单 10.10 给 出 了 一 个 完整 的 内 核定 时 器 使 用 模板 ， 大 多 数 情 况 下 ， 设 备 驱动 都 如 这 个 
模板 那样 使 用 定时 器 。 

































































因此 该 函 
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代码 清单 10.10 ”内 核定 时 器 使 用 模板 
1 /*xxx 设备 结构 体 */ 


2 el 
3 struct cdev cdev; 























4 & o 
5 timer list xxx timer;/* 设 备 要 使 用 的 定时 器 */ 
6 ); 
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E 
8 /*xxx 驱动 中 的 某 函 数 */ 


"oso Cancri 


@O@ 











9 14 

1 struct xxx dev *dev = filp-»private data; 
dr cro 

3 /* 初 始 化 定时 器 */ 

4 init timer(&dev-»xxx timer); 

5  dev-»xxx timer.function = &xxx do timer; 
6  dev-»xxx timer.data = (unsigned long)dev; 
7 /* 设 备 结 构 体 指针 作为 定时 器 处 理 函数 参数 */ 
8 dev->xxx timer.expires = jiffies + delay; 
9  /*WS (注册) 定时 器 */ 
20 add timer(&dev-»xxx timer); 
2al 
PS) 
PE 


24 /*xxx 驱动 中 的 某 函 数 */ 
2o REUN CZAR) 
AO A 





28 /* 删 除 定时 器 */ 


29 del timer (&dev->xxx timer); 
Sub 


33 /# 定 时 器 处 理 函 数 */ 

34 static void xxx do timer(unsigned long arg) 

33 1 

36 struct xxx device *dev - (struct xxx device *) (arg); 
ou t 

38 ”/* 调 度 定时 器 再 执行 */ 


39  dev-»xxx timer.expires = jiffies + delay; 

















40 add timer(&dev-»xxx timer); 
41 
42 } 


从 代码 清单 第 18、39 行 可 以 看 出 ,定时 器 的 到 期 时 间 往 往 是 
时 延 ， 若 为 Hz， 则 表示 延迟 1s。 

在 定时 器 处 理 函 数 中 ， 在 做 完 相应 的 工作 后 ， 往 往 会 延 后 expires 并 将 定时 器 再 次 添加 到 内 核 
定时 器 链表 ， 以 便 定时 器 能 再 次 被 触发 。 


10.5.2 ”内 核 中 延迟 的 工作 delayed work 
注意 ， 对 于 这 种 周期 性 的 任务 ，Linux 内 核 还 提供 了 一 套 封 装 好 的 快捷 机 制 ， 其 本 质 利 用 工作 队列 
和 定时 器 实现 ， 这 套 快捷 机 制 是 就 是 delayed work, delayed work 结构 体 的 定义 如 代码 清单 10.11 所 示 。 
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目前 jiffies 的 基础 是 添加 一 个 
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代码 清单 10.11 delayed work 结构 体 


Struct delayed work 1 
(Sek Vocis [Sibi eub we 


; 


1l 
2 
3 eee ea Se ein 
4 
BS Sn ON ee 
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atomic Lonu bL gets 





6 

yi define WORK_STRUCT_PENDING 0 

8 define WORK_STRUCT_FLAG MASK (3UL) 

9 define WORK STRUCT WO DATA MASK (-—WORK STRUCT FLAG MASK) 
10 struct list head entry; 

Abit DWIGHT REIS RUNE, 

12 fifdef CONFIG LOCKDEP 

dL struct lockdep map lockdep map; 

14 #endif 

Log 








我 们 可 以 通过 如 下 函数 调度 一 个 delayed work 在 指定 的 延 时 后 执行 : 
int schedule delayed work(struct delayed work *work, unsigned long delay); 
当 指 定 的 delay 到 来 时 delayed work 结构 体 中 work 成 员 的 work. func t 类 型 成 员 func) 2 k 
执行 。work func t 类 型 定义 为 : 
typedef void (*work func t) (struct work struct *work); 
delay 参数 的 单位 是 jiffies， 因 此 一 种 常见 的 用 法 如 下 : 
Schedule delayed work(&work, msecs to jiffies(poll interval)); 
的 msecs to_jiffiesO 用 于 将 毫秒 转化 为 jiffies。 
如 果 要 周期 性 的 执行 任务 ， 通 常会 在 delayed work 的 工作 函数 中 再 次 调用 schedule delayed | 
work()， 周 而 复 始 。 
如 下 函数 用 来 取消 delayed work: 


int cancel delayed work(struct delayed work *work); 
















































































































































































int cancel delayed work sync(struct delayed work *work); 


10.5.3 ”实例 : 秒 字符 设备 

下 面 我 们 编写 一 个 字符 设备 “second”( 即 “ 秒 ”) 的 驱动 ， 它 在 被 打开 的 时 候 初始 化 一 个 定 
时 器 并 将 其 添加 到 内 核定 时 器 链表 ， 每 秒 输出 一 次 当前 的 jiffies (为 此 ， 定 时 器 处 理 函 数 中 每 次 
都 要 修改 新 的 expires)， 整 个 程序 如 代码 清单 10.11 所 示 。 
代码 清单 10.12 ”使 用 内 核定 时 器 的 second 字符 设备 驱动 


linux/module.h» 































































































include 
linux/types.h» 
linux/fs.h» 

linux/errno.h» 


include 


LO N 


include 





~ 


include 
linux/mm.h> 
linux/sched.h» 
linüux/init.h» 


include 
include 
include 





JAN. AN CAS EAST AST AS AA 


include «linux/cdev.h» 


T E R 


include <asm/io.h> 
include <asm/system.h> 





include <asm/uaccess.h> 











define SECOND MAJOR 248 /* 预 设 的 second 的 主 设备 号 */ 
static int second major = SECOND MAJOR; 
/*second 设备 结构 体 */ 


sitruot secondodew 1 
struct cdev cdev; /*cdev 结构 体 */ 





TO DD. uberi OP Cup CA NOE Feb SO 
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© 
D 

20 atomic t counter;/* 一 共 经 历 了 多 少 秒 ? */ ® 

2n struct timer list s timer; /* 设 备 要 使 用 的 定时 器 */ 

22 Jp 

23) 

24 struct second dev *second devp; /* 设 备 结构 体 指针 */ 

25 

26 /* 定 时 器 处 理 函 数 */ 

27 static void second timer handle (unsigned long arg) 

ZION 

2S) mod timer(&second devp->s_timer,jiffies + Hz); 

30 atomic inc(&second devp-»counter); 

31 

mr printk(KERN NOTICE "current jiffies is $1dWMn", jiffies); 

Sieb 

34 

35 /* 文 件 打 开 函 数 */ 

oom nuEsccondmcpensbicieuinoccg inode ein MOST) 

S. t 

38 /* 初 始 化 定时 器 */ 

mu init timer(&second devp-»s timer); 

40 Second devp-»s timer.function = &second timer handle; 

41 Second devp->s timer.expires = jiffies + Hz; 

42 

43 add timer(&second devp-»s timer); /* 添 加 (注册 ) 定时 器 */ 

44 

45 atomic set(&second devp-»counter,0); // 计 数 清 0 

46 

47 return 0; 

48 } 

49 /* 文 件 释放 函数 */ 

50 int second release(struct inode *inode, struct file *filp) 

XE 

22 del timer(&second devp-»s timer); 

53 

54 return 0; 

EM 

56 

57 /*iEER CS / 

58 static ssize t second read(struct file *filp, char --user *buf, size t count, 

59 lerne E eos 

GONE 

61 int counter; 

62 

63 counter = atomic read(&second devp-»counter); 

64 if(put user(counter, (int*)buf)) 

65 return - EFAULT; 

66 else 

67 return sizeof (unsigned int); 

68 ] 

69 

70. /* 文 件 操作 结构 体 */ 

71 static const struct file operations second fops = { 

12 .Owner « THIS MODULE, 

7:3) .open = second open, 

74 .release = second release, 
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T9 .read — second read, 
76 ); 
Tg 
78 /* 初 始 化 并 注册 cdev*/ 
79 static void second setup cdev(struct second dev *dev, int index) 
SOME 
81 int err, devno = MKDEV (second major, index); 
82 
83 cdev init(&dev-»cdev, &second fops); 
84 dev-»cdev.owner = THIS MODULE; 
85 err = cdev add(&dev-»cdev, devno, 1); 
86 LE AELE) 
87 printk(KERN NOTICE "Error $d adding LED$d", err, index); 
Su I 
89 
90 ”/* 设 备 驱 动 模块 加 载 函 数 */ 
91 int second init (void) 
92 i 
93 int ret; 
94 dev t devno = MKDEV (second major, 0); 
95 
96 /* 申请 设备 号 */ 
E if (second major) 
98 ret = register chrdev region(devno, 1, "second"); 
99 else ( /* 动态 申请 设备 号 */ 
00 ret = alloc chrdev region(&devno, 0, 1, "second"); 
01 Second major = MAJOR (devno); 
02 } 
os aen Ease < 89) 
04 return ret; 
05  /* 动态 申请 设备 结构 体 的 内 存 */ 
06 second devp = kmalloc(sizeof(struct second dev), GEP KERNEL); 
07 if (!second devp) (  /* 申 请 失败 */ 
08 ret = - ENOMEM; 
09 goto fail malloc; 
0 l 
JL 
2 memset (second devp, 0, sizeof(struct second dev)); 
3 
4 Second setup cdev (second devp, 0); 
B5 
6 eee a dE 
7 
65 Sn 
加 unregister chrdev region(devno, 1); 
20 return ret; 
2L 
22 
23 /* 模 块 扼 载 函 数 */ 
24 void second exit (void) 
DONE 
26 cdev del(&second devp-»cdev);  /*ik8jcdev*/ 
27 kfree (second devp); /* 释 放 设 备 结 构 体 内 存 */ 
28 unregister chrdev region (MKDEV (second major, 0), 1); /# 释 放 设 备 号 */ 
DOE 
aui INUX 
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30 
31 MODULE AUTHOR("Barry Song «21cnbaoGgmail.com»"); 
32 MODULE LICENSE ("Dual BSD/GPL"); 
33 
34 module param(second major, int, S IRUGO); 
39 
36 module init(second init); 
37 module exit(second exit); 
在 second 的 open0 函 数 中 ， 将 启动 定时 器 ， 此 后 每 1s 会 再 次 运行 定时 器 处 理 函数 ， 在 second 
的 release() 函 数 中 ， 定 时 器 被 删除 。 
second dev 结构 体 中 的 原子 变量 counter 用 于 秒 计数 ， 每 次 在 定时 器 处 理 函 数 中 将 被 atomic_inc() 
































调用 原子 的 增 1, second 的 read() 函 数 会 将 这 个 值 返回 给 用 

/home/lihacker/develop/svn/1dd6410-read-only/training/kernel/drivers/second 包含 了 second 设备 
驱动 以 及 second test.c 用 户 空间 测试 程序 ， 运 行 make 命令 编译 得 到 second.ko 和 second test, Jl 
载 second.ko 内 核 模 块 并 创建 “/dev/second” 设 备 文件 结 点 : 


root@lihacker-laptop:/home/lihacker/deve 





户 空间 。 
























































lop/svn/ldd6410-read-only/training/kernel/d 
rivers/second4 mknod /dev/second c 248 0 


代码 清单 10.13 给 出 了 second test.c 这 个 应 
自打 开 “/dev/second” 设 备 文 件 以 来 经 历 的 秒 数 。 


代码 清单 10.13 second 设备 用 户 空 间 测试 程序 



























































程序 ， 它 打开 “/dev/second”， 其 后 不 断 地 读 取 

















int counter - 0; 


T 

2 

3 

4 

3 ine fd: 
6 

7 int old counter - 0; 
8 





























9 /*1]JF /dev/second 设备 文件 */ 

10 fd = open("/dev/second", O RDONLY); 

ALL TE (EC ppc 

13 while (1) ( 

15 read(fd,&counter, sizeof (unsigned int));/* 读 目前 经 历 的 秒 数 */ 
16 if(counter!-old counter) { 

18 printf ("seconds after open /dev/second :%d\n", counter); 
L$ old counter = counter; 

20 } 

2L ) 

22 } else { 

25 printf ("Device open failure\n"); 

2$ 

Z2. nt 

i&1T second test 后 ， 内 核 将 不 断 地 输出 目前 的 jiffies f: 

[44335.554313] current jiffies is 11008888 

[44336.553166] current jiffies is 11009138 

[44337.553175] current jiffies is 11009388 

[44338.552383] current jiffies is 11009638 

[44339.552321] current jiffies is 11009888 
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而 应 用 程序 将 不 断 输出 自打 开 /dec/second 以 来 经 历 的 秒 数 : 


rootGülihacker-laptop:/home/lihacker/develop/svn/1dd6410-read-only/training/kernel/d 





cu 














rivers/second4 ./second test 
seconds after open /dev/second : 
seconds after open /dev/second : 
seconds after open /dev/second : 
seconds after open /dev/second : 


n 5 U N | 


seconds after open /dev/second : 


| 


0.6 内 核 延 时 


10.6.1 XER 
Linux 内 核 中 提供 了 如 下 3 个 函数 分 别 进行 纳 秒 、 微 秒 和 毫秒 延迟 : 


void ndelay(unsigned long nsecs 

















); 
void udelay(unsigned long usecs); 
void mdelay(unsigned long msecs); 


上 述 延 迟 的 实现 原理 本 质 上 是 忙 等 待 ， 它 根据 CPU 频率 进行 一 定 次 数 的 循环 。 有 时 候 ， 人 们 

在 软件 中 进行 这 样 的 延迟 : 
void delay(unsigned int time) 
{ 
























































while (time--); 

} 

ndelay(). udelay()fll mdelay0 函 数 的 实现 方式 机 理 与 此 类 似 。 内 核 在 启动 时 ， 会 运行 一 个 延 
迟 测试 程序 (delay loop calibration )， 计 算出 Ipj Coops per jiffy), 例如 对 于 LDD6410 电路 板 而 言 ， 
内 核 启动 时 会 打印 : 

Calibrating delay loop... 530.84 BogoMIPS (1pj-1327104) 

毫秒 时 延 〈《 以 及 更 大 的 秒 时 延 ) 已 经 比较 大 了 ， 在 内 核 中 ， 最 好 不 要 直接 使 用 mdelayO EA Zt, 
这 将 无 谓 地 耗费 CPU 资源 ， 对 于 诸 秒 级 以 上 时 延 ， 内 核 提 供 了 下 述 函 数 : 


void msleep(unsigned int millisecs); 

































































unsigned long msleep interruptible (unsigned int millisecs); 
void ssleep(unsigned int seconds); 


上 述 函 数 将 使 得 调用 它 的 进程 睡眠 参数 指定 的 时 间 ，msleepO0、ssleep0 不 能 被 打 断 ， 而 
msleep_interruptibleO 则 可 以 被 打 断 。 






























































* 


受 系统 Hz ARAE VIE B CT] , msleepO2S ADLER LES TS E Je PRÉS 





10.6.2 ”长 延迟 
内 核 中 进行 延迟 的 一 个 很 直观 的 方法 是 比较 当前 的 jiffies 和 目标 jiffies (设置 为 当前 jiffies 加 
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上 时 间 间 隔 的 jiffies)， 直 到 未 来 的 jiffies 达到 目标 jiffies。 代 码 清单 10.14 给 出 了 使 用 忙 等 待 先 延 
iR 100 个 jiffies 再 延迟 2s 的 实例 。 
代码 清单 10.14 ” 忙 等 待 时 延 实例 


/* 延 迟 100 个 jiffies*/ 
unsigned long delay - jiffies * 100; 
































eo 


















































while (time before(jiffies, delay)); 











/# 再 延迟 2s*/ 
unsigned long delay - jiffies -* 2*Hz; 











1 
2 
3 
4 
5 
6 
7 


while (time before(jiffies, delay)); 
与 time before0 对 应 的 还 有 一 个 time_after()， 它 们 在 内 核 中 定义 为 (实际 上 只 是 将 传 入 的 未 
来 时 间 jiffies 和 被 调用 时 的 jiffies 进行 一 个 简单 的 比较 ): 



























































#define time after (a,b) N 
(typecheck (unsigned long, a) && \ 
typecheck (unsigned long, b) && \ 
((l1ong) Go - (1ong)(a) « 0)) 

#define time before (a,b) time after (b,a) 











为 了 防止 time before()ll time_after0 的 比较 过 程 中 编译 器 对 jiffies 的 优化 ， 内 核 将 其 定义 为 
volatile 变量 ， 这 将 保证 它 每 次 都 被 重新 读 取 。 


10.6.3 EAER 

睡 着 延迟 无 疑 是 比 忙 等 待 更 好 的 方式 ， 睡 着 延迟 在 等 待 的 时 间 到 来 之 间 进 程 处 于 睡眠 状态 ， 
CPU 资源 被 其 他 进程 使 用 。schedule timeout0 可 以 使 当前 任务 睡眠 指定 的 jiffies 之 后 重新 被 调度 
执行 ，msleep0 和 msleep_interruptible() 在 本 质 上 都 是 依靠 包含 了 schedule timeout() 的 schedule_ 
timeout_uninterruptible() 和 schedule timeout interruptibleO 实 现 的 ， 如 代码 清单 10.15 所 示 。 























































































































































































































代码 清单 10.15 schedule timeout() 的 使 用 


void msleep(unsigned int msecs) 
{ 


unsigned long timeout = msecs to jiffies(msecs) + 1; 


1l 

2 

9 

4 

D while (timeout) 
6 timeout = schedule timeout uninterruptible (timeout); 
Jo 

8 

9 unsigned long msleep interruptible (unsigned int msecs) 

{ 


unsigned long timeout = msecs to jiffies(msecs) + 1; 


while (timeout && !signal pending (current)) 
timeout = schedule timeout interruptible (timeout); 
return jiffies to msecs (timeout); 
} 
KERE, schedule timeoutO 的 实现 原理 是 向 系统 添加 一 个 定时 器 ， 在 定时 器 处 理 函 数 中 唤醒 
参数 对 应 的 进程 。 
代码 清单 10.15 第 6 行 和 第 14 行 分 别 调用 schedule timeout uninterruptibleg0 和 schedule timeout - 
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interruptible() ， 这 两 个 函数 的 区 别 在 于 前 者 在 调用 schedule timeout0 之 前 置 进 程 状态 为 TASK 
INTERRUPTIBLE， 后 者 置 进程 状态 为 TASK _UNINTERRUPTIBLE， 如 代码 清单 10.16 所 示 。 






















































































代码 清单 10.16 schedule timeout interruptible() 和 schedule timeout interruptible() 


1 signed long — sched schedule timeout interruptible(signed long timeout) 
( 

| Set current state(TASK INTERRUPTIBLE); 

return schedule timeout (timeout); 


} 


signed long _ sched schedule timeout uninterruptible(signed long timeout) 
{ 

9 | Set current state(TASK UNINTERRUPTIBLE); 

10 return schedule timeout (timeout); 

Abd. jr 


另外 ， 下 面 两 个 函数 可 以 将 当前 进程 添加 到 等 待 队列 中 ， 从 而 在 等 待 队列 上 睡 
生 时 ， 进 程 将 被 唤醒 《后 者 可 以 在 超时 前 被 打 断 ): 


Sleep on timeout(wait queue head t *q, unsigned long timeout); 


co -)0 01 T CQ ho 
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interruptible_sleep_on_timeout (wait queue head t*q, unsigned long timeout); 


10.7 RE 


Linux 的 中 断 处 理 分 为 两 个 半 部 ， 顶 半 部 处 理 紧 急 的 硬件 操作 ， 底 半 部 处 理 不 紧急 的 耗 时 操 
作 。tasklet 和 工作 队列 都 是 调度 中 断 底 半 部 的 良好 机 制 ，tasklet 基于 软 中 断 实现 。 内 核定 时 器 也 
依靠 软 中 断 实现 。 
内 核 中 的 延 时 可 以 采用 忙 等 待 或 睡眠 等 待 ， 为 了 充分 利用 CPU 资源 ， 使 系统 有 更 好 的 吞吐 性 
能 ， 在 对 延迟 时 间 的 要 求 并 不 是 很 精确 的 情况 下 ， 睡 眠 等 待 通常 是 值得 推荐 的 。 而 ndelay(). udelay() 
忙 等 待机 制 在 驱动 中 通常 是 为 了 配合 硬件 上 短 时 延迟 要 求 。 
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提供 了 复杂 的 内 存 管 理 
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功能 ， 所 以 内 存 的 概念 在 











相对 复杂 ， 出 现 了 常规 内 存 、 高 端 内 存 、 虚 拟 地 址 、 逻 辑 
设备 内 存 、 预 留 内 存 等 概念 。 本 章 


ERIS 














内 存 和 LO 的 访问 编程 ， 带 您 走 
解 内 存 和 VO 的 硬件 机 制 ， 主 要 涉及 内 存 空间 、IO 空间 和 




















解 Linux 的 内 存 管理 、 内 存 














上 内 存 和 IO 的 概念 迷 富 。 





区 域 的 分 布 、 常 规 内 存 与 





解 Linux 内 存 存 取 的 方法 ， 
地 址 的 方法 。 
4 IO VEI LO 端 
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要 涉及 内 存 动态 申 请 以 及 通关 











口 的 访问 流程 





























EE 大 ， 设 备 驱 动 使 用 此 节 的 方法 访问 物理 
区 动 中 的 DMA 与 CACHE — 3 
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CPU 与 内 存 和 1/0 


11.1.1 内 存 空 间 与 MO 空间 


在 X86 处 理 器 中 存在 着 IO 空间 的 概念 ，LIO 空间 是 相对 于 内 存 空间 而 言 的 ， 它 通过 特 
定 的 指令 in、out 来 访问 。 端 口号 标识 了 外 设 的 寄存 器 地 址 。Intel 语法 的 in. out 指令 格式 
如 下 : 

IN 累加 器 ， {端口 号 | DX} 

OUT {端口 号 |DX}, 累加 器 
Qo SAR MS PaPe rh ERTO 2: 间 ， 而 仅 存 在 内 存 空间 。 
pec qum 指针 来 访问 ， 程 序 和 程序 运行 中 使 用 的 变量 和 其 他 数据 都 存在 于 内 
存 空 


















































































































































































































































het 地 址 可 以 直接 由 C 语言 指针 操作 ， 例 如 在 186 处 理 器 

unsigned char *p = (unsigned char *)OxFOOOFFO00; 

*p-11; 

以 上 程序 的 意义 为 在 绝对 地 址 0xF0000+0xFF00 (186 处 理 器 使 用 16 位 段 地 址 和 16 位 偏 移 地 址 ) 
写 入 11。 

而 在 ARM. PowerPC 等 未 采用 段 地 址 的 处 理 器 中 ，p 指向 的 内 存 空间 就 是 0xF000FF00， 而 
*p = 1] 就 是 在 该 地 址 写 入 11。 

再 如 ，186 处 理 器 启动 后 会 在 绝对 地 址 0xFFFF0 (对 应 C 语言 指针 是 0xF000FFF0，0xF000 
为 段 地 址 ，0xFFF0 为 段 内 偏 移 ) 执行 ， 请 看 下 面 的 代码 : 

typedef void (*lpFunction) ( ); /* 定义 一 个 无 参数 、 无 返回 类 型 的 函数 指针 类 型 */ 

lpFunction lpReset = (lpFunction)OxFOO0FFF0; /* 定义 一 个 函数 指针 ， 指 向 */ 

/* CPU 启动 后 所 执行 第 一 条 指令 的 位 置 */ 

lpReset(); /* 调用 函数 */ 
在 以 上 程序 中 ,没有 定义 任何 一 个 函数 实体 ， 但 是 程序 中 却 执行 了 这 样 的 函数 调用 : 
lpReset()， 它 实际 上 起 到 了 “ 软 重启 ”的 作用 ， 跳 转 到 CPU 启动 后 第 一 条 要 执行 的 指令 的 位 
置 。 因 此 ， 可 以 通过 函数 指针 调用 一 个 没有 函数 体 的 “函数 ” 本 质 上 只 是 换 一 个 地 址 开始 
执行 。 
即便 是 在 X86 处 理 器 中 ， 虽 然 提 供 了 UO 空间 ， 如 果 由 我 们 自己 设计 电路 板 ， 外 设 仍然 可 以 只 
挂 接 在 内 存 空间 。 此 时 ，CPU 可 以 像 访问 一 个 内 存单 元 那样 访问 外 设 IO 端口 ， Wn ny 
的 VO 指令 。 因 此 ， 内 存 空间 是 必须 的 ， 而 IO 空间 是 可 选 的。 图 11.1 给 出 了 内 存 空 间 和 IO 空 
的 对 比 。 


执行 如 下 代码 : 
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代码 is 



































内 存 























外 设 























内 存 空间 (必须) 


11.4. 内存 空 间 和 I/O 空间 


11.1.2 ”内 存 管 理 单元 MMU 


高 性 能 处 理 器 一 般 会 提供 一 个 内 存 管理 单元 MMU)， 该 单元 辅助 操作 系统 进行 内 存 管理 ， 
提供 虚拟 地 址 和 物理 地 址 的 映射 、 内 存 访问 权限 保护 和 Cache 缓存 控制 等 硬件 支持 。 操 作 系统 内 
核 借 助 MMU， 可 以 让 用 户 感觉 到 好 像 程序 可 以 使 用 非常 大 的 内 存 空 间 ， 从 而 使 得 编程 人 员 在 写 
程序 时 不 用 考虑 计算 机 中 的 物理 内 存 的 实际 容量 。 

为 了 理解 基本 的 MMU 操作 原理 ， 需 先 明 晰 几 个 概念 。 

(1) TLB: Translation Lookaside Buffer， 即 转换 旁 路 缓存 ，TLB 是 MMU 的 核心 部 件 ， 它 
缓存 少量 的 虚拟 地 址 与 物理 地 址 的 转换 关系 ， 是 转换 表 的 Cache， 因 此 也 经 常 被 称 为 “ 快 表 ”。 

(2) TTW: Translation Table walk， 即 转换 表 漫游 ， 当 TLB 中 没有 缓冲 对 应 的 地 址 转换 关系 
时 ， 需 要 通过 对 内 存 中 转换 表 〈 大 多 数 处 理 器 的 转换 表 为 多 级 页 表 ， 如 图 11.2 所 示 ) 的 访问 来 获 
导 虚 拟 地 址 和 物理 地 址 的 对 应 关系 。TTW 成 功 后 ， 结 果 应 写 入 TLB. 
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页 表 基 址 寄存 器 





11.2 内存 中 的 转换 表 






































图 11.3 给 出 了 一 个 典型 的 ARM 处 理 器 访问 内 存 的 过 程 ， 其 他 处 理 器 也 执行 类 似 过 程 。 当 ARM 
要 访问 存储 器 时 ，MMU 先 查 找 TLB 中 的 虚拟 地 址 表 。 如 果 ARM 的 结构 支持 分 开 的 数据 TLB 
CDTLB) 和 指令 TLB (ITLB)， 则 除 取 指 令 使 用 ITLB 外 ， 其 他 的 都 使 用 DTLB。ARM 处 理 器 的 
MMU 如 图 11.3 所 示 。 
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11.3 ARM 的 内 存 管 理 单元 














存储 器 中 的 转换 表 中 获取 地 













































































zi TLB 中 没有 虚拟 地 址 的 入 口 ， 则 转换 表 遍 历 硬件 从 存放 于 3 
址 转换 信息 和 访问 权限 〈 即 执行 TTW)， 同 时 将 这 些 信 息 放 入 TLB， 它 或 者 被 放 在 一 个 没有 使 
E TLB 条目 中 控制 信息 的 控制 下 ， 当 访问 权限 












































用 的 入 口 或 者 蔡 换 一 个 已 经 存在 的 入 口 。 之 后 ， 


允许 时 ， 对 真实 物理 地 址 的 访问 将 在 Cache 或 者 在 内 存 ， 











发 生 ， 如 图 11.4 所 示 。 















































Cache Bit=1 


访问 内 存 






11.4 ARM CPU 进行 数据 访问 的 流程 
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ARM 中 的 TLB 条 目 中 的 控制 信息 用 于 控制 对 对 应 地 址 的 访问 权限 以 及 Cache 的 操作 
e C (高 速 绥 存 ) 和 B CRW) 位 被 用 来 控制 对 应 地 址 的 高 速 缓存 和 写 缓冲 ， 并 决定 是 
高 速 缓存 。 
e 访问 权限 和 域 位 用 来 控制 读 写 访问 是 否 被 允许 。 如 果 不 允 许 ， 则 MMU 将 向 ARM 处 到 
器 发 送 一 个 存储 器 异常 ， 否 则 访问 将 被 允许 进行 。 
上 述 描述 的 MMU 机 制 针 对 的 虽然 是 ARM 处 理 器 ， 但 PowerPC, MIPS 等 其 他 处 理 器 也 均 有 
类 似 的 操作 。 
MMU 具有 虚拟 地 址 和 物理 地 址 转换 、 内 存 访问 权限 保护 等 功能 ， 这 将 使 得 Linux. 操作 系统 
能 单独 为 系统 的 每 个 用 户 进 程 分 配 独立 的 内 存 空间 并 保证 用 户 空 间 不 能 访问 内 核 空间 的 地 址 ， 为 
操作 系统 的 虚拟 内 存 管理 模块 提供 硬件 基础 。 
Linux 内 核 使 用 了 三 级 页 表 PGD、PMD 和 PTE， 对 于 许多 体系 结构 而 言 ，PMD 这 一 级 实际 上 
只 有 一 个 入 口 。 代 码 清单 11.1 给 出 了 一 个 典型 的 从 虚拟 地 址 得 到 PTE 的 页 表 查 询 (page table walk) 
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c 
>H 
Hi 
o 


代码 清单 11.1 Linux 的 三 级 页 表 与 页 表 查 询 
1 static int walk page tables(struct mm struct *mm, 
2 unsigned long address, 
9 pte t *pte ret) 
A d 
5 joreyok se. pod; 
6 pmd t *pmd; 
7 pte t *ptep; 
8 4ifdef HAVE PUD T 
9 





pud t *pud; 
0 #endif 
il 
2 pgd = pgd offset (mm, address); 
3 if (pgd none(*pgd) || unlikely (pgd bad (*pgd))) 
4 goto out; 
5 
6 #ifdef HAVE_PUD T 
7 pud = pud offset (pgd, address); 
8 if (pud none(*pud) || unlikely (pud eC ne 
9 goto out; 
20 
21  pmd = pmd offset(pud, address); 
22 #else 
23 pmd = pmd offset(pgd, address); 
24 #endif 


25 if (pmd none (*pmd) 


unlikely (pmd bad (*pmd))) 
26 goto out; 

271  ptep = pte offset map(pmd, address); 

2S s ee 

29 goto out; 


Og pte ret CD 
32 pte unmap(ptep); 
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S4  peturm 0: 
353 OUTS 

Sio. garian cbe 
Su 


第 1 行 的 类 型 为 struct mm struct 的 参数 mm 用 于 描述 Linux 进程 所 tU. ERAR 
码 中 的 pgd offset. pmd offset 分 别 用 于 得 到 一 级 页 表 和 二 级 页 表 的 入 口 ， 最 后 通过 pte offset map 
得 到 目标 页 表 项 。 
但 是 ，MMU 并 非 对 所 有 处 理 器 都 是 必须 的 ， 例 如 常用 的 SAMSUNG 基于 ARM7TDMI 系列 
的 S3C44BOX 不 附带 MMU， 新 版 的 Linux 2.6 支持 不 带 MMU 的 处 理 器 。 在 嵌入 式 系统 中 ， 仍 存 
在 大 量 无 MMU 的 处 理 器 ，Linux 2.6 为 了 更 广泛 地 应 用 于 挫 入 式 系统 ， 融 合 了 uClinux， 以 支持 这 
些 MMU-less 系统 ， 如 Dragonball, ColdFire, Hitachi H8/300、Blackfin 等 。 


Linux 内 存 管 理 


对 于 包含 MMU 的 处 理 器 而 言 ，Linux 系统 提供 了 复杂 的 存储 管理 系统 ， 使 得 进程 所 能 访问 
的 内 存 达 到 4GB. 

在 Linux 系统 中 ， 进 程 的 4GB 内 存 空间 被 分 为 两 个 部 分 j 户 空间 与 内 核 空 间 。 用 户 空间 
地 址 一 般 分 布 为 0~3GB (EN PAGE OFFSET, 在 0x86 中 它 等 于 0xC0000000)， 这 样 ， 剩 下 的 3 一 
4GB 为 内 核 空间 ， 如 图 11.5 所 示 。 用 户 进程 通常 情况 下 只 能 访问 用 户 空 间 的 虚拟 地 址 ， 不 能 访问 
内 核 空 间 虚 拟 地 址 。 用 户 进程 只 有 通过 系统 调用 《代表 用 户 进程 在 内 核 态 执行 ) 等 方式 才 可 以 访 
问 到 内 核 空 间 。 











































































































































































































































































































































































































































































































4GB 


23 
—PAGE_OFFSET— 3GB 内 核 空 间 
2GB 
日 
1GB 用 户 空间 
0 


图 11.5 用 户 空间 与 内 核 空间 



































每 个 进程 的 用 户 空间 都 是 完全 独立 、 互 不 相干 的 ， 用 户 进程 各 自 有 不 同 的 页 表 。 而 内 核 空 间 
是 由 内 核 负 责 映 射 ， 它 并 不 会 跟着 进程 改变 ， 是 固定 的 。 内 核 空 间 地 址 有 自己 对 应 的 页 表 ， 内 核 
的 虚拟 空间 独立 于 其 他 程序 。 

Linux 中 1GB 的 内 核 地 址 空间 又 被 划分 为 物理 内 存 映射 区 、 虚 拟 内 存 分 配 
区 、 专 用 页 面 映射 区 和 系统 保留 映射 区 这 儿 个 区 域 ， 如 图 11.6 所 示 。 

一 般 情 况 下 ， 物 理 内 存 映 射 区 最 大 长 度 为 896MB， 系 统 的 物理 内 存 被 顺序 映射 在 内 核 空 间 的 
这 个 区 域 中 。 当 系统 物理 内 存 大 于 896MB 时 ， 超 过 物理 内 存 映 射 区 的 那 部 分 内 存 称 为 高 端 内 存 
(而 未 超过 物理 内 存 映 射 区 的 内 存 通常 被 称 为 常规 内 存 )， 内 核 在 存 取 高 端 内 存 时 必须 将 它们 映射 
到 高 端 页 面 映射 区 。 

Linux 保留 内 核 空 间 最 顶部 FIXADDR TOP—4GB 的 区 域 作为 保留 区 。 
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、 高 端 页 面 映射 
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4GB 
保留 区 


专用 页 面 映射 区 
高 端 内 存 映 射 区 


vmalloc 分 配器 区 





物理 内 存 映射 区 


Linux 内 核 空间 
图 11.6 Linux 内 核 地 址 空间 









































紧 接着 最 顶端 的 保留 区 以 下 的 一 段 区 域 为 专用 页 面 映射 区 (FIXADDR_START~FIXADDR_ 











TOP)， 它 的 总 尺寸 和 每 一 页 的 用 途 

















fixed address 枚 举 结构 在 编译 时 预定 义 ， 用 __fix_to_virt(index) 












































可 获取 专用 区 内 预定 义 页 面 的 逻辑 
define FIXADDR START ( 
define FIXADDR TOP ( 




















define  . 












































也 址 。 其 开始 地 址 和 结束 地 址 宏 定 义 如 下 : 














DRTOPBL FIXADDR SIZE) 
FIXADDR TOP) 








(unsigned long) 


FIXADDR TOP Oxfffff000 


接 下 来 ， 如 果 系 统 配 置 了 高 端 内 存 ， 则 位 于 专用 页 画 











映射 区 之 下 的 就 是 一 段 高 端 内 存 映 射 区 ， 





x 

















其 起 始 地 址 为 PKMAP BASE， 定 义 如 下 : 


define PKMAP BASE ( 


所 涉及 的 宏 定义 如 下 : 




















define LAST PKMAP 
define PTRS PER PTE 
define PMD MASK 


DIA 





define PMD_SHIFT 21 
在 物理 


























(FIXADDR BOOT START - PAGE SIZE*(LAST PKMAP + 1)) 


define FIXADDR BOOT START (FIXADDR TOP - 
PIRSLPER PTE 


& PMD_MASK ) 


FIXADDR BOOT SIZE) 





(ONT MID RESTO ZETA) 
define PMD SIZE (1UL «« PMD SHIFT) 











x 和 高 端 映 射 区 之 间 为 虚 存 内 存 分 配 区 (VMALLOC START—VMALLOC END), 





























用 于 vmalloc0 函 数 , 它 的 前 部 与 物理 内 存 映射 区 有 一 个 隔离 带 , 后 部 与 高 端 映射 区 也 有 











vmalloc 区 域 定义 如 下 : 
define VMALLOC OFFSET 
define VMALLOC START 
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个 隔离 带 ， 




















(8*1024*1024) 
(((unsigned long) 


high memory + 
















































































vmalloc earlyreserve 十 2*VMALLOC OFFSET-1) & -(VMALLOC OFFSET-1) 
ifdef CONFIG HIGHMEM ”/* 支 持 高 端 内 存 */ 
define VMALLOC END (PKMAP BASE-2*PAGE SIZE) 
else /* 不 支持 高 端 内 存 */ 
define VMALLOC_END (FIXADDR START-2*PAGE. SIZE) 
endif 
当 系 统 物理 内 存 超过 AGB 时 ， 必 须 使 用 CPU 的 扩展 分 页 (PAE) 模式 所 提供 的 64 位 页 目录 
项 才能 存 取 到 AGB 以 上 的 物理 内 存 ， 这 需要 CPU 的 支持 。 加 入 了 PAE 功能 的 Intel Pentium Pro 
及 其 后 的 CPU 允许 内 存 最 大 可 配置 到 64GB， 具 备 36 位 物理 地 址 空间 寻 址 能 力 。 
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此 可 见 ， 在 3—4GB 之 间 的 内 核 空 间 中 ， 从 低地 址 到 高 地 址 依次 为 : 物理 内 存 映射 区 一 隔离 带 一 
vmalloc 虚拟 内 存 分 配器 一 隅 离 带 一 高 端 内 存 映 射 区 一 专用 页 面 映射 区 一 保留 区 。 


内 存 存 取 


1 1.3.1 用 户 空 e 间 内 存 动态 申请 
在 用 户 空间 动态 申请 内 存 的 函数 为 malloc0， 这 个 函数 在 各 种 操作 系统 上 的 使 用 是 一 致 的 ， 
mallocO 申 请 的 内 存 的 释放 函数 为 free()。 
malloc() 的 内 存 一 定 要 被 free()， 否 则 会 造成 内 存 泄漏 。 理 想 情 况 下 ，malloc() 和 free0) 应 成 对 
出 现 ， 即 谁 申 请 ， 就 由 谁 释放 。 例 如 下 面 的 一 段 程序 : 
(imus $ tnetionl ry 
{ 
(Eie oy 
o = chan anion: 
if (p--NULL) 











































































































































































































. /* 一 系列 针对 p 的 操作 */ 
return p; 

i 
在 某 处 调用 function), MÆ function() 中 动态 申请 的 内 存 后 将 其 free， 如 下 : 


char *q - function(); 





















































free (q); 
上 述 代 码 并 不 合理 的 ， 因 为 违反 了 malloc0 和 free0 成 对 出 现 的 原则 。 不 满足 这 个 原则 ， 
致 代 码 的 耦合 度 增 大 ， 因 为 用 户 在 调用 function() 函 数 时 需要 知道 其 内 部 细节 。 

较 好 的 做 法 是 在 调用 处 申请 内 存 ， 并 传 入 function K% W FZ: 


char *p=malloc (…) ; 
if (p--NULL) 




















































































































function (p); 

free(p); 

p-NULL; 

而 函数 fonction0 则 接收 参数 p， 如 下 所 示 ; 


void function(char *p) 


./* 一 系列 针对 p 的 操作 */ 

















完全 让 malloc0 和 free0 成 对 出 现 有 时 候 很 难 做 到 ， 即 便 如 此 ， 也 应 尽力 将 malloc0 申 请 内 存 
的 释放 限制 在 本 模块 范围 之 内 。 如 果 在 A 模块 申请 的 内 存 需 在 B 模块 释放 ， 一 般 而 言 ， 软 件 结构 
的 设计 可 能 存在 问题 。 

对 于 Linux 内 核 而 言 ，C 库 的 malloc) K ZOR HEE brk0 和 mmap0 两 个 系统 调 





































































































j 来 实现 。 
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11.3.2 ”内 核 空间 内 存 动态 申请 


在 Linux 内 核 空间 申请 内 存 涉 及 的 函数 主要 包括 kmalloc()、 _get_free_pages() 和 vmalloc() 等 。 
kmalloc()fll ”_get_free_pages( 〇 (及 其 类 似 函 数 ) 申请 的 内 存 位 于 物理 内 存 映射 区 域 ， 而 且 在 物理 
上 也 是 连续 的 ， 它 们 与 真实 的 物理 地 址 只 有 一 个 固定 的 偏 移 ， 因 此 存在 较 简单 的 转换 关系 。 而 
vmalloc(0 在 虚拟 内 存 空 间 给 出 一 块 连续 的 内 存 区 ， 实 质 上 ， 这 片 连续 的 虚拟 内 存在 物理 内 存 中 
不 一 定 连续 ， 而 vmalloc0 申 请 的 虚拟 内 存 和 物理 内 存 之 间 也 没有 简单 的 换算 关系 。 

1. kmalloc() 


void *kmalloc(size t size, int flags); 


给 kmallocO 的 第 一 个 参数 是 要 分 配 的 块 的 大 小 ， 第 二 个 参数 为 分 配 标志 ， 
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所 kmalloc() 




















最 常用 的 分 配 标 志 是 GFP_KERNEL， 其 含义 是 在 内 核 空间 的 进程 中 申请 内 存 。kmallocO 的 底 
层 依赖 。_get free pages() 实 现 , 分 配 标志 的 前 级 GFP 正好 是 这 个 底层 函数 的 缩写 。 使 用 GFP_ 
KERNEL 标志 申请 内 存 时 ， 若 暂时 不 能 满足 ， 则 进程 会 睡眠 等 待 页 ， 即 会 引起 阻塞 ， 因 此 不 能 在 
中 断 上 下 文 或 持 有 自 旋 锁 的 时 候 使 用 GFP_KERNE 申请 内 存 。 

在 中 断 处 理 函 数 、tasklet 和 内 核定 时 器 等 非 进程 上 下 文中 不 能 阻塞 ， 此 时 驱动 应 当 使 用 
GFP ATOMIC 标志 来 申请 内 存 。 当 使 用 GFP. ATOMIC 标志 申请 内 存 时 ， 若 不 存在 空闲 页 ， 则 不 
等 待 ， 直 接 返 回 。 
其 他 的 相对 不 常用 的 申请 标志 还 包括 GFP_ USER. (用 来 为 用 户 空间 页 分 配 内 存 ， 可 能 阻塞 )、 
GFP HIGHUSER 类似 GFP_USER, 但 是 从 高 端 内 存 分 配 )、GFP_NOIO (不 允许 任何 VO 初始 
化 )、GFP_NOFS 不 允许 进行 任何 文件 系统 调用 )、 ”_GFP_DMA (要 求 分 配 在 能 够 DMA 的 内 
存 区 )、__GFP_HIGHMEM (指示 分 配 的 内 存 可 以 位 于 高 端 内 存 )、__GFP_COLD 请 求 一 个 较 
长 时 间 不 访问 的 页 )、__GFP_NOWARN ( 当 一 个 分 配 无 法 满足 时 , 阻止 内 核发 出 警告 )__GFP_HIGH 
(高 优先 级 请 求 ， 人 允许 获得 被 内 核 保留 给 紧急 状况 使 用 的 最 后 的 内 存 页 )、 — GFP. REPEAT. (分 配 失 
败 则 尽力 重复 尝试 )、 _GFP_NOFAIL (标志 只 许 申请 成 功 ,不 推荐 ) 和 ”GFP_NORETRY ( 若 申请 
不 到 ， 则 立即 放弃 )。 
使 用 kmallocO0 申 请 的 内 存 应 使 用 kfreeO 释 放 ， 这 个 函数 的 用 法 和 用 户 空间 的 free 28401. 

2. | get free pages () 

. get free pages0 系 列 函数 / 宏 是 Linux. 内 核 本 质 上 最 底层 的 用 于 获取 空闲 内 存 的 方法 ， 
为 底层 的 伙伴 算法 以 page 的 2 的 次 寡 为 单位 管理 空闲 内 存 ， 所 以 最 底层 的 内 存 申请 总 是 以 页 为 
单位 的 。 

. get free pages(O) 系 列 函 数 / 宏 包括 get zeroed page()、_ get free page()fll get free pages). 

get zeroed page(unsigned int flags); 

该 函数 返回 一 个 指向 新 页 的 指针 并 且 将 该 页 清 零 。 

Se JURE oa ne ise “Ea 

该 宏 返 回 一 个 指向 新 页 的 指针 但 是 该 页 不 清 零 ， 它 实际 上 为 : 

$define | get free page(gfp mask) V 

. get free pages ((gfp mask),0) 


就 是 调用 了 下 面 的 。” get free pagesQ Hi 1 页 。 
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该 函数 可 分 配 多 个 页 并 返回 分 配 内 存 的 首 地 址 ， 分 配 的 页 数 为 2"*"， 分 配 的 页 也 不 清 零 。order 
允许 的 最 大 值 是 10 〈 即 1024 页 ) 或 者 11〈 即 2 048 页 )， 依 赖 于 具体 的 硬件 平 

. get free pages 0 和 get zeroed page (0 的 实现 中 调用 了 alloc_pages0 函 数 ，alloc_pagesO 既 可 
以 在 内 核 空 间 分 配 ， 也 可 以 在 用 户 空间 分 配 ， 其 原型 为 : 

struct page * alloc pages(int gfp mask, unsigned long order); 

参数 含义 与 _get_free_pages() 类 似 ， 但 它 返 回 分 配 的 第 一 个 页 的 描述 符 而 非 首 地 址 。 
使 用 ”get free pagesO 系 列 函 数 / 宏 申请 的 内 存 应 使 用 下 列 函数 释放 : 


void free page(unsigned long addr); 
































o 


n» 
































Seer 
















































































void free_pages (unsigned long addr, unsigned long order); 


如 果 申 请 和 释放 的 order 不 一 样 ， 则 会 引起 内 存 的 混乱 。 


. get free pages 等 函数 在 使 用 时 ， 其 申请 标志 的 值 与 kmalloc0 完 全 一 样 ， 各 标志 的 含义 也 与 
kmallocO 完 全 一 致 ， 最 常用 的 是 GFP KERNEL 和 GFP ATOMIC. 

3. vmalloc() 

vmalloc() 一 般 用 在 为 只 存在 于 软件 中 (没有 对 应 的 硬件 意义 ) 的 较 大 的 顺序 缓冲 区 分 配 内 存 ， 
vmalloc0 远 大 于 — get free_pages() 的 开销 ， 为 了 完成 vmalloc0， 新 的 页 表 需 要 被 建立 。 因 此 ， 只 是 
调用 vmalloc0) 来 分 配 少量 的 内 存 〈 如 1 页 ) ERW. 

vmalloc() 申 请 的 内 存 应 使 用 vfree0 释 放 ，vmalloc0 和 vfree0 的 函数 原型 如 下 : 


void *vmalloc(unsigned long size); 












































































































































void vfree(void * addr); 
vmallocO 不 能 用 在 原子 上 下 文中 ， 因 为 它 的 内 部 实现 使 用 了 标志 为 GFP KERNEL 的 kmalloc(). 
使 用 vmalloc 函数 的 一 个 例子 函数 是 create moduleO 系 统 调 用 ， 它 利用 vmalloc0 函 数 来 获取 
被 创建 模块 需要 的 内 存 空间 。 

4. slab 与 内 存 池 

一 方面 ， 完 全 使 用 页 为 单元 申请 和 释放 内 存 容易 导致 浪费 (如 果 要 申请 少量 字 节 也 需要 1 D. 
另 一 方面 ， 在 操作 系统 的 运作 过 程 中 ， 经 常会 涉及 大 量 对 象 的 重复 生成 、 使 用 和 释放 内 存 问题 。 在 
Linux 系统 中 所 用 到 的 对 象 ， 比 较 典 型 的 例子 是 inode, task struct 等 。 如 果 我 们 能 够 用 合适 的 方法 
使 得 在 对 象 前 后 两 次 被 使 用 时 分 配 在 同一 块 内 存 或 同一 类 内 存 空 间 且 保 留 了 基本 的 数据 结构 ， 就 可 
以 大 大 提高 效率 。slab 算法 就 是 针对 上 述 特点 设计 的 。 实 际 上 kmalloc0 即 是 使 用 slab 机 制 实现 的 。 

(1) 创建 slab 缓存 。 


struct kmem cache *kmem cache create(const char *name, size t size, 
























































































































































































































































[sr 




















Size t align, unsigned long flags, 
void (*ctor) (void*, struct kmem cache *, unsigned long), 
void (*dtor) (void*, struct kmem cache *, unsigned long)); 


kmem cache create() H T 8] £& —^ slab 缓存 ， 它 是 一 个 可 以 驻 留 任意 数目 全 部 同样 大 小 的 后 
备 缓存 。 参 数 size 是 要 分 配 的 每 个 数据 结构 的 大 小 ， 参 数 flags 是 控制 如 何 进行 分 配 的 位 掩 码 ， 包 
括 SLAB NO_REAP《〈 即 使 内 存 紧 缺 也 不 自动 收缩 这 块 缓存 )、SLAB_HWCACHE ALIGN 每 个 
数据 对 象 被 对 齐 到 一 个 缓存 行 )、SLAB CACHE DMA (要 求 数据 对 象 在 DMA 内 存 区 分 配 ) 等 。 
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(2) 分 配 slab 缓存 。 

void *kmem cache alloc(struct kmem cache *cachep, gfp t flags); 
上 述 函 数 在 kmem cache. create() 8] ££ RJ slab 后 备 缓冲 中 分 配 一 块 并 返 
(3) 释放 slab 缓存 。 

void kmem cache free(struct kmem cache *cachep, void *objp); 

上 述 函 数 释 放 由 kmem cache alloc0 分 配 的 缓存 。 

(4) 收回 slab 缓存 。 


int kmem cache destroy(struct kmem cache *cachep); 


代码 清单 11.2 给 出 了 slab 缓存 的 使 用 范例 。 
代码 清单 11.2 slab 缓存 使 用 范例 


eoe 
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首 地 址 指针 。 




































































/* 创 建 slab 缓存 */ 
Static kmem cache t *xxx cachep; 
Xxx cachep = kmem cache create("xxx", sizeof(struct xxx), 
0, SLAB HWCACHE ALIGN|SLAB PANIC, NULL, NULL); 
/* 分 配 slab 缓存 */ 
struet > ct 
ctx = kmem cache alloc(xxx cachep, GFP KERNEL); 
.../* TERI slab ZEE */ 
9 /*fj slab 缓存 */ 


10 kmem cache free(xxx cachep, ctx); 


OO - Oy OY iB c6 BOO px 

















11 kmem cache destroy(xxx cachep); 
在 系统 中 通过 /proc/slabinfo 结 点 可 以 获知 当前 slab 的 分 配 和 使 用 情况 ， 例 如 在 LDD6410 开发 
板 上 运行 “cat /proc/slabinfo ": 


H cat /proc/slabinfo | more 





















































slabinfo - version: 2.1 

# name <active_objs> <num_objs> 《objsize> 《objperslab> <pagesperslab> 
: tunables «limit? <batchcount> <sharedfactor> : slabdata <active_slabs> «num s 

labs» «sharedavail» 

rpc buffers 8 2048 : tunables 24 12 : sla 

bdata 4 4 

rpc tasks 160 : tunables 60 : sla 

bdata 1 

rpc inode cache 516 : tunables 54 27 : sla 

bdata 0 

flow_cache : tunables 120 60 : sla 

bdata 0 

cfq 1o context : tunables 120 : sla 

bdata 

cfq queue : tunables 120 : sla 

bdata 0 

mqueue inode cache : tunables 534 : sl 

abdata 

jffs2 inode cache : tunables 120 : sla 

bdata 0 

jffs2 node frag : tunables 120 : sla 

bdata 0 0 

jffs2 refblock : tunables 120 : sla 

--More-- 








二 


注意 ，slab 不 是 要 代替 ，_get free pages0， 其 在 最 底层 仍然 依赖 于 __get free_ pages()，slab 
在 底层 每 次 申请 1 页 或 多 页 ， 之 后 再 分 隔 这 些 页 为 更 小 的 单元 进行 管理 ， 从 而 节省 了 内 存 ， 也 提 
高 了 slab 缓冲 对 象 的 访问 效率 。 

除了 slab 以 外 ， 在 Linux 内 核 中 还 包含 对 内 存 池 的 支持 ， 内 存 池 技术 也 是 一 种 非常 经 典 的 用 
于 分 配 大 量 小 对 象 的 后 备 缓存 技术 。 
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Linux 内 核 中 ， 与 内 存 池 相关 的 操作 包括 如 下 几 种 





o 





(1) 创建 内 存 池 。 


mempool t *mempool create(int min nr, mempool alloc t *alloc fn, 


mempool free t *free fn, void *pool data); 


mempool createO 函 数 用 于 创建 一 个 内 存 池 ，min_nr 参数 是 需要 预 分 配对 象 的 数目 ，alloc fn 
和 free fn 是 指向 内 存 池 机 制 提供 的 标准 对 象 分 配 和 回收 函数 的 指针 ， 其 原型 分 别 为 : 


typedef void *(mempool alloc t) (int gfp mask, void *pool data); 


和 





















































typedef void (mempool free t) (void *element, void *pool data); 











pool data 是 分 配 和 回收 函数 用 到 的 指针 ，gfp_mask 是 分 配 标记 。 只 有 当 _ 












































指定 时 ， 分 配 函 数 才 会 休眠 。 
(2) 分 配 和 回收 对 象 。 
在 内 存 池 中 分 配 和 回收 对 象 需 由 以 下 函数 来 完成 : 

















void *mempool_al 











lloc(mempool t *pool, int gfp mask); 


void mempool free(void *element, mempool t *pool); 

















_GFP WAIT 标记 被 




















mempool allocO) 
































void mempool destroy (mempool t *pool); 


mempool create(0 函 数 创 建 的 内 存 池 需 由 mempool destroy ()? [n] Ui 


11.3.3 ”虚拟 地 址 与 物理 地 址 关系 



























































] 来 分 配对 象 ， 如 果 内 存 池 分 配器 无 法 提供 内 存 ， 那 么 就 可 以 用 预 分 配 的 池 。 
(3) 回收 内 存 池 。 











对 于 内 核 物理 内 存 映射 区 的 虚拟 内 存 ， 使 用 virt to_phys0 可 以 实现 内 核 虚 拟 地 址 转化 为 物 




















ES 











清单 11.3 所 示 。 


return 


CA SEE GOES 












































上 面 转换 过 程 的 PAGE_ OFFSET 38 
的 基地 址 。 因 此 ， 对 了 
SDRAM 的 首 地 址 映射 到 3GB。 

















代码 清单 11.3 virt to_phys() 函 数 


static inline unsigned long virt to phys(void *x) 


Lo wLrt te physctunsliegned Tong) E 


define _ virt to phys (x) ((x) - PAGE OFFSET + PHYS OFFSET) 
常 为 3GB， 而 PHYS OFFSET 则 定 于 为 系统 DRAM 内 存 






































F LDD6410 电路 板 而 言 ， 并 不 是 将 0 地 址 映射 到 3GB， 


























里 地 址 ，virt to_physO 的 实现 是 体系 结构 相关 的 ， 对 于 ARM 而 言 ，virt to_physO 的 定义 如 代码 


而 是 将 外 接 的 DDR 


与 之 对 应 的 函数 为 phys_to_virt()， 它 将 物理 地 址 转化 为 内 核 虚拟 地 址 ，phys_to_virt0 的 定义 
如 代码 清单 11.4 所 示 。 























代码 清单 11.4 phys to _virt() 函 数 


static inline void *phys to virt(unsigned long x) 


E 

S return (void *)( phys to virt((unsigned long) (x))); 

4 p 

5 4$define phys to virt (x) ((x) - PHYS OFFSET + PAGE OFFSET) 





注意 ， 上 述 virt to physO fll phys to virt()77 32 

















仅 适 用 于 896MB 以 下 的 低 端 内 存 ， 高 端 内 存 的 








INUX 





内 存 与 I/O 访问 

















虚拟 地 址 与 物理 地 址 之 间 不 存在 如 此 简单 的 换算 关系 。 














Í 1.4. 设备 I/O 端口 和 1/O 内 存 的 访问 


设备 通常 会 提供 一 组 寄存 器 来 用 于 控制 设备 、 读 写 设备 和 获取 设备 状态 ， 即 控制 寄存 器 、 数 
据 寄存 器 和 状态 寄存 器 。 这 些 寄存 器 可 能 位 于 LO 空间 ， 也 可 能 位 于 内 存 空间 。 当 位 于 VO 空间 
时 ， 通 常 被 称 为 IO 端口 ， 位 于 内 存 空 间 时 ， 对 应 的 内 存 空 间 被 称 为 IO 内 存 。 


11.4.1 Linux I/O 端口 和 1/O 内 存 访 问 接口 





















































































































































1. 1/O 端口 

fr Linux 设备 驱动 中 ， 应 使 用 Linux 内 核 提 供 的 函数 来 访问 定位 于 IO 空间 的 端口 ， 这 些 函 
数 包 括 如 下 几 种 。 

CD 读 写 字 节 端口 (8 位 宽 )。 








unsigned inb(unsigned port); 
void outb 


unsigned char byte, unsigned port); 
(2) 读 写 字 端 口 〈16 位 宽 )。 


unsigned inw(unsigned port); 








void outw(unsigned short word, unsigned port); 
(3) 读 写 长 字 端 口 (32 位 宽 )。 


unsigned inl(unsigned port); 








void outl(unsigned longword, unsigned port); 
(4) R'E—H SEN, 


void insb(unsigned port, void *addr, unsigned long count); 








void outsb(unsigned port, void *addr, unsigned long count); 

(5) insb0 从 端口 port 开始 读 count 个 字 节 端口 ， 并 将 读 取 结 果 写 入 addr 指向 的 内 存 ; outsb() 
将 addr 指向 的 内 存 的 count 个 字 节 连续 地 写 入 port 开始 的 端口 。 

(6) 读 写 一 串 字 。 


void insw(unsigned port, void *addr, unsigned long count); 









































void outsw(unsigned port, void *addr, unsigned long count); 
CD 读 写 一 串 长 字 。 

void insl(unsigned port, void *addr, unsigned long count); 

void outsl(unsigned port, void *addr, unsigned long count); 

















































































































上 述 各 函数 中 IO 端口 号 port 的 类 型 高 度 依赖 于 具体 的 硬件 平台 ， 因 此 ， 只 是 写 出 了 unsigned. 

2. VO 内 存 

在 内 核 中 访问 VO 内 存 之 前 ， 需 首先 使 用 ioremap0 函 数 将 设备 所 处 的 物理 地 址 映射 到 虚拟 地 
址 。ioremapO 的 原型 如 下 : 


void *ioremap(unsigned long offset, unsigned long size); 

ioremap() 5 vmallocO 类 似 ， 也 需要 建立 新 的 页 表 , 但 是 它 并 不 进行 vmallocO0 中 所 执行 的 内 存 
分 配 行 为 。ioremap0) 返 回 一 个 特殊 的 虚拟 地 址 ， 该 地 址 可 用 来 存 取 特定 的 物理 地 址 范围 。 通 过 
ioremap() 获 得 的 虚拟 地 址 应 该 被 iounmap() 函 数 释放 ， 其 原型 如 下 : 


void iounmap ne * addr); 
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在 设备 的 物理 地 址 被 映射 到 虚拟 地 址 之 后 ， 尽 管 可 以 直接 通过 指针 访问 这 些 地 址 ， 但 是 可 以 



























































就 可 








] Linux 内 核 的 如 下 一 组 函数 来 完成 设备 内 存 映 射 的 虚拟 地 址 的 读 写 ， 这 些 函 数 如 下 所 示 。 
CD 读 IO 内 存 。 


unsigned int ioread8 (void *addr); 





unsigned int ioreadl6(void *addr); 
unsigned int ioread32(void *addr); 


与 上 述 函数 对 应 的 较 早 版 本 的 函数 为 《这 些 函数 在 Linux 2.6 中 仍然 被 支持 ): 


unsigned readb (address); 




















unsigned readw (address); 
unsigned readl (address); 


(2) 5S VO 内 存 。 


void iowrite8(u8 value, void *addr); 
void iowritel6(ul16 value, void *addr); 
void iowrite32(u32 value, void *addr); 


与 上 述 函数 对 应 的 较 早 版 本 的 函数 为 《这 些 函数 在 Linux 2.6 中 仍然 被 支持 ): 


void writeb(unsigned value, address); 


























void writew(unsigned value, address); 
void writel(unsigned value, address); 


(3) 读 一 串 VO 内 存 。 


void ioread8 rep(void *addr, void *buf, unsigned long count); 





void ioreadl6 rep(void *addr, void *buf, unsigned long count); 
void ioread32 rep(void *addr, void *buf, unsigned long count); 


(4) 写 一 串 IO 内 存 。 


void iowrite8 rep(void *addr, const void *buf, unsigned long count); 





void iowritel6 rep(void *addr, const void *buf, unsigned long count); 
void iowrite32 rep(void *addr, const void *buf, unsigned long count); 


(5) 复制 IO 内 存 。 


void memcpy fromio(void *dest, void *source, unsigned int count); 
void memcpy toio(void *dest, void *source, unsigned int count); 


(60 设置 IO 内 存 。 


void memset io(void *addr, u8 value, unsigned int count); 


3. 把 1/O 端口 映射 到 内 存 空 间 


void *ioport map(unsigned long port, unsigned int count); 
通过 这 个 函数 ， 可 以 把 port 开始 的 count 个 连续 的 IO 端口 重 映射 为 一 段 “ 内 存 空间 ”然后 
以 在 其 返回 的 地 址 上 像 访 问 UO 内 存 一 样 访问 这 些 IO 端口 。 需要 
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下 面 的 函数 来 撤销 。 








的 一 





11 











void ioport unmap(void *addr); 
实际 上 上， 分析 ioport_map0 的 源 代码 可 发 现 ， 映 射 到 内 存 空 间 行为 实际 上 是 给 开发 人 员 制 造 
个 “假象 ” 并 没有 映射 到 内 核 虚 拟 地 址 ， 仅 仅 是 为 了 让 工程 师 可 使 用 统一 的 IO 内 存 访问 接 



























































口 访问 IO 端口 。 








.4.2 ”申请 与 释放 设备 |/O 端口 和 I/O PIE 


1. V/O 端口 申请 
Linux 内 核 提 供 了 一 组 函数 用 于 申请 和 释放 IO 端口 。 


struct resource *request region (unsigned long first, unsigned long n, const char *name); 
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这 个 函数 向 内 核 申 请 n 个 端口 ， 这 些 端 口 从 first 开始 ，name 参数 为 设备 的 名 称 。 如 果 分 配 










































































成 功 返 回 值 是 非 NULL， 如 果 返 回 NULL， 则 意味 着 申请 端口 失败 。 
当 用 request_region0 申 请 的 IO 端口 使 用 完成 后 ， 应 当 使 用 release_region0) 函 数 将 它们 归还 给 



































系统 ， 这 个 函数 的 原型 如 
void release region(unsigned long start, unsigned long n); 


2. VO 内 存 申请 

同样 ，Linux 内 核 也 提供 了 一 组 函数 用 于 申请 和 释放 IO 内 存 的 范围 。 

struct resource *request mem region (unsigned long start, unsigned long len, char *name); 

这 个 函数 向 内 核 申 请 n 个 内 存 地 址 ， 这 些 地 址 从 first 开始 ，name 参数 为 设备 的 名 称 。 如 果 
分 配 成 功 返 回 值 是 非 NULL， 如 果 返 回 NULL， 则 意味 着 申请 IO 内 存 失败 。 

当 用 request mem region HI] IO 内 存 使 用 完成 后 ， 应 当 使 用 release mem region) AOK 
它们 归还 给 系统 ， 这 个 函数 的 原型 如 下 : 

void release mem region(unsigned long start, unsigned long len); 

上 述 request region()ll release mem region() 都 不 是 必须 的 ,但 建议 使 用 。 其 任务 是 检查 申请 的 资 
源 是 否 可 用 ， 如 果 可 用 则 申请 成 功 ， 并 标志 为 已 经 使 用 ， 其 他 驱动 想 再 次 申请 该 资源 时 就 会 失败 。 

有 许多 设备 驱动 程序 在 没有 申请 VO 端口 和 VO 内 存 之 前 就 直接 访问 了 ， 这 不 够 安全 。 


11.4.3 ”设备 IO 端口 和 1/O 内 存 访问 流程 

综合 11.3 节 和 本 节 的 内 容 ， 可 以 归纳 出 设备 驱动 访问 IO 端口 和 IO 内 存 的 步骤 。 

VO 端口 访问 的 一 种 途径 是 直接 使 用 VO 端口 操作 函数 : 在 设备 打开 或 驱动 模块 被 加 载 时 申请 
VO 端口 区 域 , 之 后 使 用 inbO0、outb0 等 进行 端口 访问 ,最 后 , 在 设备 关闭 或 驱动 被 外 载 时 释放 IO 
端口 范围 。 整 个 流程 如 图 11.7 所 示 。 


inb(.outb 0 等 “| 在 设备 驱动 初始 化 、write 〇 、 
read () ~ ioctl O 等 函数 中 进行 


11.7 VO 端口 的 访问 流程 ( 不 映射 到 内 存 空间 ) 
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VO 端口 访问 的 另 一 种 途径 是 将 IO 端口 映射 为 内 存 进行 访问 : 在 设备 打开 或 驱动 模块 被 加 载 
时 ， 申 请 IO 端口 区 域 ]ioport map(O 映 射 到 内 存 ， 之 后 使 用 VO 内 存 的 函数 进行 端口 访问 ， 
最 后 ， 在 设备 关闭 或 驱动 被 卸载 时 释放 IO 端口 并 释放 映射 。 整 个 流程 如 图 11.8 所 示 。 
IO 内 存 的 访问 步骤 如 图 11.9 所 示 ， 首 先是 调用 request mem _region() 申 请 资源 ， 接 着 将 寄存 
器 地 址 通过 ioremapO 了 映射 到 内 核 空 间 虚 拟 地 址 ， 之 后 就 可 以 通过 Linux 设备 访问 编程 接口 访问 这 
些 设备 的 寄存 器 了 。 访问 完成 后 ， 应 对 ioremap() 申 请 的 虚拟 地 址 进行 释放 ， 并 释放 release mem 
region() 申 请 的 1/O 内 存 资源 。 
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request. region () request. mem. region () 


在 设备 驱动 模块 加 载 或 在 设备 驱动 模块 加 载 或 
open() 函数 中 调用 open 0 函数 中 进行 


ioport_map() 


| 


在 设备 驱动 初始 化 、write ()、 ioread8、 ioread16(). 在 设备 驱动 初始 化 、write 0、 
read () ~ ioctl 0 等 函数 中 调用 ioread32()、iowrite8() 等 | | read O~ ioctl O 等 函数 中 进行 


NEN 





ioread8、 ioread16(). 
ioread320 ~ iowrite8 0 等 


ioport. unmap () 





A 





在 设备 驱动 模块 印 载 或 在 设备 驱动 模块 印 载 或 
release () 函数 中 调用 release (函数 中 进行 
release region () release. mem. region () 
11.8 l/O 端口 的 访问 流程 ( 映射 到 内 存 空 间 ) 11.9 l/O 内 存 访问 流 


11.4.4 将 设备 地 址 映射 到 用 户 空间 

1. 内 存 映 射 与 VMA 

一 般 情况 下 ， 用 户 空间 是 不 可 能 也 不 应 该 直接 访问 设备 的 ， 但 是 ， 设 备 驱动 程序 中 可 实现 
mmap() 函 数 ， 这 个 函数 可 使 得 用 户 空间 直 能 接 访问 设备 的 物理 地 址 。 实 际 上 ,mmap(0) 实 现 了 这 样 
的 一 个 映射 过 程 : 它 将 用 户 空间 的 一 段 内 存 与 设备 内 存 关 联 ， 当 用 户 访问 用 户 空间 的 这 段 地 址 范 
围 时 ， 实 际 上 会 转化 为 对 设备 的 访问 。 

这 种 能 力 对 于 显示 适配器 一 类 的 设备 非常 有 意义 ， 如 果 用 户 空间 可 直接 通过 内 存 映 射 访问 显 
存 的 话 ， 屏 幕 帧 的 各 点 的 像素 将 不 再 需要 一 个 从 用 户 空间 到 内 核 空 间 的 复制 的 过 程 。 

mmap0 必 须 以 PAGE SIZE 为 单位 进行 映射 ， 实际 上 ， 内 存 只 能 以 页 为 单位 进行 映射 ， 若 要 映 
射 非 PAGE_SIZE 整数 倍 的 地 址 范围 ， 要 先进 行 页 对 齐 ， 强 行 以 PAGE_SIZE 的 倍数 大 小 进行 映射 。 

从 file operations 文件 操作 结构 体 可 以 看 出 ， 驱 动 中 mmap0 〇 函数 的 原型 如 下 : 

int(*mmap) (struct file *, struct vm area struct*); 
驱动 中 的 mmap0 函 数 将 在 用 户 进 行 mmap0O 系 统 调 用 时 最 终 被 调用 ，mmap0O 系 统 调 用 的 原型 
与 file operations 中 mmap0 的 原型 区 别 很 大 ， 如 下 所 示 : 

cerelebe 15. mmap er lL ee cweloha, Se diio, neo ne on ee le (ol eo eo 

参数 fd 为 文件 描述 符 ， 一 般 由 open0 返 回 ，fd 也 可 以 指定 为 -1， 此 时 需 指 定 flags 参数 中 的 
MAP_ANON， 表 明 进 行 的 是 匿名 映射 。 

len 是 映射 到 调用 用 户 空 间 的 字 节 数 ， 它 从 被 映射 文件 开头 offset 个 字 节 开始 算 起 ，offset 参 
数 一 般 设 为 0， 表示 从 文件 头 开 始 映射 。 

prot 参数 指定 访问 权限 ， 可 取 如 下 几 个 值 的 “或 ” PROT READ (可 读 )、PROT_ WRITE (可 
写 )、PROT_EXEC (可 执行 ) 和 PROT_NONE (不 可 访问 )。 

参数 addr 指定 文件 应 被 映射 到 用 户 空 间 的 起 始 地 址 ， 一 般 被 指定 为 NULL， 这 样 ， 选 择 起 始 
地 址 的 任务 将 由 内 核 完 成 ， 而 函数 的 返回 值 就 是 映射 到 用 户 空间 的 地 址 。 其 类 型 caddr t 实际 上 就 


是 void *。 
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内 存 与 uo 访问 e 















































ee 


当 用 户 调 用 mmap() 的 时 候 ， 内 核 会 进行 如 下 人 处理。 
Q 在 进程 的 虚拟 空间 查找 一 块 VMA。 
D 将 这 块 VMA 进行 映射 。 
© 如 果 设 备 驱 动 程序 或 者 文件 系统 的 file operations 定义 了 mmap0) 操 作 ， 则 调用 它 。 
D 将 这 个 VMA 插入 进程 的 VMA 链表 中 。 

file operations 中 mmapO 函 数 的 第 一 个 参数 就 是 步骤 中 中 找到 的 VMA。 
mmap() 系 统 调用 映射 的 内 存 可 由 munmapO 解 除 映 射 ， 这 个 函数 的 原型 如 下 : 


int munmap(caddr t addr, size t len ); 
驱动 程序 中 mmap0 的 实现 机 制 是 建立 页 表 ， 并 填充 VMA 结构 体 中 vm operations struct 指针 。 
VMA E} vm_area_struct， 用 于 描述 一 个 虚拟 内 存 区域 ，VMA 结构 体 的 定义 如 代码 清单 11.5 所 示 。 


代码 清单 11.5 VMA 结构 体 







































































































































































Struct vm area struct ET 
struct mm struct *vm mm; /* 所 处 的 地 址 空间 */ 
unsigned long vm start; /* 开始 虚拟 地 址 */ 
unsigned long vm end; /* 结束 虚拟 地 址 */ 

















unsigned long vm flags; /* hi, VM READ/VM WRITE/VM EXEC/VM _ SHARED */ 


/* 操作 VMA 的 函数 集 指 针 */ 


0 struct vm operations struct *vm ops; 





1L 
2 
3 
4 
9 
6 pgprot t vm page prot; /* 访问 权限 */ 
Jl 
8 
9 
3L 
1L 


12 unsigned long vm pgoff; /* 偏 移 〈 页 帧 号 ) */ 
1.9; Sem et 

14 void *vm private data; 

d nes 
1. f 

VMA 结构 体 描述 的 虚 地 址 介 于 vm start 和 vm end 之 间 ， 而 其 vm ops 成 员 指向 这 个 VMA 
的 操作 集 。 针 对 VMA 的 操作 都 被 包含 在 vm operations struct 结构 体 中 ，vm_operations_struct 结 
构 体 的 定义 如 代码 清单 11.6 所 示 。 






























































代码 清单 11.6 vm operations struct 结构 体 
struct vm operations struct [( 

void(*open) (struct vm area struct *area); /*1]Jf VMA 的 函数 */ 

void(*close) (struct vm area struct *area); /* XH] VvMA 的 函数 */ 

struct page *(*nopage) (struct vm area struct *area, unsigned long address, 
int *type); /* 访 问 的 页 不 在 内 存 时 调用 */ 

int(*populate) (struct vm area struct *area, unsigned long address, unsigned 
long len, pgprot t prot, unsigned long pgoff, int nonblock); 






































}; 

竺 内 核 生成 一 个 VMA 后 , 它 会 调用 该 VMA 的 open) ER Zt, 例如 fork 一 个 继承 父 继承 资源 
的 子 进程 时 。 但 是 ， 当 用 户 进 行 mmap0 〇 系统 调用 后 ， 尽 管 VMA 在 设备 驱动 文件 操作 结构 体 的 
mmap() 被 调用 前 就 已 产生 ， 内 核 却 不 会 调用 VMA 的 open0) 函 数 ， 通 常 需要 在 驱动 的 mmapO P 
数 中 显示 调用 vma->vm_ops->open()。 代 码 清 单 11.7 给 出 了 一 个 vm operations struct 的 操作 
范例 。 








2 
3 
4 
5 
6 
dl 
8 
9 
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ED 





代码 清单 11.7 vm operations struct 操作 范例 


static int xxx mmap(struct file *filp, struct vm area struct *vma) 


{ 


} 


if (remap pfn range(vma, vma-»vm start, vm-»vm pgoff, vma-»vm end - vma 





-»vm start, vma-»vm page prot)) /* 建立 页 表 */ 
return - EAGAIN; 
vma-»vm ops = &xxx remap vm ops; 


Xxx vma open (vma); 


return 0; 














void xxx vma open(struct vm area struct *vma) /* VMA 打开 函数 */ 


} 


printk(KERN NOTICE "xxx VMA open, virt ln ul vma-»vm start, 
vma-»vm pgoff << PAGE SHIFT); 


void xxx vma close(struct vm area struct *vma) / /NMA 关闭 函数 


1 


} 


printk(KERN NOTICE "xxx VMA close.Nn"); 


static struct vm operations struct xxx remap vm ops = ( /* VMA 操作 结构 体 */ 


Open oT OPSI; 
.Close = xxx_vma_close, 

















3 行 调用 的 remap pfn rangeO 创 建 页 表 ， 以 VMA 结构 体 的 成 员 (VMA 的 数据 成 员 是 内 核 





























根据 ) 














户 的 请 求 自己 填充 的 ) 作为 remap pfn rangeO 的 参数 ， 映 射 的 虚拟 地 址 范围 是 vma->vm_ 














start 至 vma-»vm end. 
remap pfn range() 函 数 的 原型 如 下 : 


int remap pfn range (struct vm area struct *vma, unsigned long addr, 














之 间 的 虚拟 地 址 构造 页 表 。 











unsigned long pfn, unsigned long size, pgprot t prot); 


对 开始 处 的 虚拟 地 址 。remap pfn range0 函 数 为 addr~addrtsize 








的 addr 参数 表示 内 存 映 身 












































pfn 是 虚拟 地 址 应 该 映射 到 的 物理 地 址 的 页 帧 号 ， 实 际 上 就 是 物理 地 址 右 移 PAGE_SHIFT 位 。 
若 PAGE SIZE 为 4KB， 则 PAGE SHIFT 为 12， 因 为 PAGE SIZE 等 于 1<<PAGE SHIFT。 


prot 是 新 页 所 要 求 的 保护 属性 。 
























































在 驱动 程序 中 , 我 们 能 使 用 remap pfn range0 了 映射 内 存 中 的 保留 页 (如 X86 系统 中 的 640KB 一 
















































































1MB 区 域 ) 和 设备 IO 内 存 ， 另 外 ,kmalloc0 申 请 的 内 存 若 要 被 映射 到 用 户 空间 可 以 通过 mem map 
reserve0 设 置 为 保留 后 进行 。 代 码 清单 11.8 给 出 了 映射 kmalloc0 申 请 的 内 存 到 用 户 空 间 的 典型 范例 。 























































































































代码 清单 11.8 ”映射 kmalloc() 申 请 的 内 存 到 用 户 空间 范例 





/* 内 核 模 块 加 载 函 数 */ 


TE ne oe mea tmit (aes) 


{ 








内 存 与 I/O 访问 e 




















eoe 



























































E /* 申请 设备 号 、 添 加 cdev 结构 体 */ 

6 buffer = kmalloc(BUF SIZE, GFP KERNEL); // 申 请 buffer 
Xi 

8 for (page = virt_to_page (buffer); page < virt_to_page (buffer + BUF SIZE); 
9 Page++) 

0 mem map reserve(page); /* 置 页 为 保留 */ 

i y 

2 /*mmap () 函数 */ 

3 static int kmalloc map mmap(struct file *filp, struct vm area struct *vma) 
a oq 

5 unsigned long page, pos; 

6 unsigned long start = (unsigned long)vma-»vm start; 

7 unsigned long size = (unsigned long) (vma-»vm end - vma-»vm start); 
8  printk(KERN INFO "mmaptest mmap called Wn"); 

9  /* 用 户 要 映射 的 区 域 太 大 */ 
20 if (size » BUF SIZE) 
Zu return - EINVAL; 
22 
23 pos = (unsigned long)buffer; 
24  /* WU buffer 中 的 所 有 页 */ 
25) while (size » O0) ( 
26 /* 每 次 映射 一 页 */ 
2 page = virt to phys((void*)pos); 
28 if (remap page range(start, page, PAGE SIZE, PAGE SHARED)) 
219 return - EAGAIN; 
30 start t= PAGE SIZES 
SL pos F= PAGE SIZE; 
32 size -= PAGE SIZE; 
ES ec 
34 ] 

















第 28 行 调用 remap page range(start, page, PAGE SIZE, PAGE SHARED) 的 第 4 个 参数 PAGE — 
SHARED 实际 上 是 PAGE PRESENT| PAGE USER| PAGE RW， 表 明 可 读 写 并 映射 到 用 户 空间 。 
通常 ，L/O 内 存 被 映射 时 需要 是 nocache 的 ， 这 时 候 ， 我 们 应 该 对 vma->vm_page_prot 设置 
nocache 标志 之 后 再 映射 ， 如 代码 清单 11.9 所 示 。 


代码 清单 11.9 以 nocache 方式 将 内 核 空间 映射 到 用 户 空 间 






















































































1 static int xxx nocache mmap(struct file *filp, struct vm area struct *vma) 

2 aq 

E vma-»vm page prot = pgprot. noncached (vma-»vm page. prot); /* IÑ nocache 标志 */ 
4 vma-»vm pgoff - ((u32)map start >> PAGE SHTET); 

5 JARIN e 

6 if (remap pfn range (vma, vma->vm_start, vma->vm pgoff, vma-»vm end - vma 

jq -»vm start, vma-»vm page prot)) 

8 return - EAGAIN; 

9 return 0; 

10 3 











上 述 代码 第 3 行 的 pgprot noncached0 是 一 个 安 ， 它 高 度 依 赖 于 CPU 体系 结构 ，ARM 的 


pgprot noncached0 定 义 如 下 : 
define pgprot noncached(prot) | pgprot(pgprot val (Prot) & -(L PTE CACHEABLE | L PTEN 
BUFFERABLE)) 


另 一 个 比 pgprot noncachedO f b — £e Bg fh 











E 


的 宏 是 pgprot_ writecombine0， 它 的 定义 如 下 : 
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#define pgprot writec 









































ombine (prot) | pgprot(pgprot val(prot) & -L PTE CACHEABLE) 
pgprot noncached0 实 际 禁 止 了 相关 页 的 Cache 和 写 缓冲 Cwrite buffer), pgprot writecombine() 























则 没有 禁止 写 缓冲 。ARM 的 写 缓冲 器 是 一 个 非常 小 的 FIFO 存储 器 ， 位 于 处 理 器 核 与 主 存 之 间 ， 





























2. nopage() 函 数 
除了 remap pfn range() 
更 加 灵活 的 内 存 映射 途径 。 



























































以 外 ， 在 驱动 程序 中 实现 VMA 的 nopage0 函 数 通常 可 以 为 设备 提供 
当 访 问 的 页 不 在 内 存 ， 即 发 生 缺 页 异常 时 ，nopage0 会 被 内 核 自 动 调 
。 这 是 因为 ， 当 发 生 缺 页 异常 时 ， 系 统 会 经 过 如 下 处 理 过 程 。 






































(1) 找到 缺 页 的 虚拟 地 址 所 在 的 VMA。 

















(2) 如 要 ， 分 配 中 











间 页 目录 表 和 页 表 。 












































Ap H 
(3) 如 果 页 表 项 对 应 的 物理 页 面 不 存在 ， 则 调用 这 个 VMA 的 nopage(0 方 法 ， 它 返 





























外 的 页 描述 符 。 












































(4) 将 物理 页 面 的 地 址 填充 到 页 表 中 。 
实现 nopageO 后 ， 用 户 空 间 可 以 通过 mremap(O 系 统 调 用 重新 绑 定 映射 区 域 所 绑 定 的 地 址 ， 代 
码 清单 11.10 给 出 了 一 个 设备 驱动 中 使 用 nopageO 的 典型 范例 。 




























































































代码 清单 11.10 “nopage() 函 数 使 用 范例 





JL- sec ine Sex Meo een ilke Ario Eeee NATL eu Ee eE AE) 
2. 4 

3 unsigned long offset = vma-»vm pgoff << PAGE SHIFT; 

4 if (offset »-  . pa(high memory) || (filp-»f flags &O SYNC)) 

5 vma->vm_flags |= VM_IO; 

6 vma->vm flags |= VM RESERVED; /* TE */ 

7 vma-»2vm ops = &xxx nopage vm ops; 

8 XXX vma open (vma); 

Ei return 0; 


} 


0 
i 
2 
9 
4 
5 
6 
7 
8 





struct page *xxx vma nopage(struct vm area struct *vma, unsigned long 
address, int *type) 


struct page *pageptr; 

unsigned long offset - vma-»vm pgoff «« PAGE SHIFT; 

unsigned long physaddr - address - vma-»vm start - offset; /* VjPEMhE */ 
unsigned long pageframe = physaddr >> PAGE SHIFT; /* 页 帧 号 */ 
































9 if (!pfn valid(pageframe)) /* 页 帧 号 有 效 ? */ 

20 return NOPAGE SIGBUS; 

21  pageptr = pfn to page(pageframe); /* 页 帧 号 -> 页 描述 符 */ 
22 get page (pageptr); /* 获得 页 ， 增 加 页 的 使 用 计数 */ 

23. ar (Cpe) 

24 *type = VM FAULT MINOR; 

25 return pageptr;  ”/* 返 回 页 描述 符 */ 

2 


























上 述 函 数 对 常规 内 存 进行 映射 ， 返 回 一 个 页 描述 符 ， 可 用 于 扩大 或 缩小 映射 的 内 存 
此 可 见 ，nopage0 与 remap pfn range() 的 一 个 较 大 区 别 在 于 remap pfn range0 一 般 用 于 设备 


























内 存 映 射 ， 而 nopage0 还 可 用 于 RAM 映射 ， 其 调用 发 生 在 缺 页 异常 时 。 








其 目的 在 于 将 处 理 器 核 和 Cache 从 较 慢 的 主 存 写 操作 中 解脱 出 来 。 写 缓冲 区 与 Cache 在 存储 层次 
上 处 于 同一 层次 ， 但 是 它 只 作用 于 写 主 存 。 


























回 物理 页 














区 域 。 
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流 的 设备 而 言 ， 实 现 这 种 映射 毫 无 意义 。 而 对 于 显示 、 视 频 等 设备 ， 建 立 映射 可 减少 用 户 空 


间 和 内 核 空间 之 间 的 内 存 拷贝 。 





IRAS] o 内 存 静 态 映射 


大 多 数 设 备 驱动 都 不 需要 提供 设备 内 存 到 用 户 空间 的 映射 能 力 ， 因 为 ， 对 于 串口 等 面向 























在 将 Linux 移植 至 








上 目标 电路 板 的 过 程 中 ， 通 常会 建立 外 设 IO 内 存 物 理 地 址 3 





















































到 虚拟 地 址 的 静 





态 映 射 ， 这 个 映射 通过 在 电路 板 对 应 的 map dese. 结构 体 数 组 中 添加 新 的 成 员 来 完成 ，map_desc 




















结构 体 的 定义 如 代码 清单 11.11 所 示 。 


代码 清单 11.11 map desc 结构 体 
1 struct map -cesc 1 
2 unsigned long virtual; /* 虚拟 地 址 */ 
3 unsigned long pfn ; /* phys to pfn(phy addr) */ 
4 
b 





unsigned long length; /* 大 小 */ 
unsigned int type; /* 2678 */ 
6 ); 


例如 ， 在 内 核 arch/arm/mach-ixp2000/ixdp2x01.c 文件 对 应 的 Intel IXDP2401 和 IXDP2801 ^F 





















































台 上 包含 一 个 CPLD, 该 文件 中 就 进行 了 CPLD 物理 地 址 到 虚拟 地 址 的 静态 映射 , 如 代码 清单 11.12 
所 示 。 
代码 清单 11.12 在 板 文 件 中 增加 物理 地 址 到 虚拟 地 址 的 静态 映射 

1l static struct map desc ixgdp2x0l1 io desc X 3initdata e i1 

2 .virtual COUTXDP2XOUSVIRINCBHDRBASB, 

3 .pf£n = phys to pfn(IXDP2X01 PHYS CPLD BASE), 

4 .length = IXDP2X01 CPLD REGION SIZE, 

5 .type = MT DEVICE 

6 Je 

7 

9 Ustatic volg — Jmit ixodp2x01 map iotvosg) 

ORE 

10 ixp2000 map io(); 

d iotable init(&ixdp2x01 io desc, 1); 

i2 m$ 








代码 清单 11.12 中 的 第 11 47 iotable init0 是 最 终 建立 页 映射 的 函数 ， 它 被 通 
START. MACHINE END 宏 赋 值 给 板 的 map_io0 函 数 。Linux 操作 系统 移植 至 









































过 MACHINE_ 
I 特定 平台 上 ， 




















MACHINE START. MACHINE END 宏 之 间 的 定义 针对 特定 电路 板 而 设计 ， 划 






































的 map_io0 成 


员 函 数 完成 IO 内 存 的 静态 映射 ， 代 码 清单 11.13 给 出 了 IXDP2401 FRETI] MACHINE START, 











MACHINE END 宏 的 例子 。 


代码 清单 11.13. IXDP2401 电路 板 的 MACHINE START, MACHINE END Z 


1 MACHINE START(IXDP2401, "Intel IXDP2401 Development Platform") 
p /* Maintainer: MontaVista Software, Inc. */ 
3 .phys io = IXP2000 UART PHYS BASE, 
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co -10 0! 4 


E 


.io pg offst = ((IXP2000 UART VIRT BASE) 
= 0x00000100, 
lxdpzx0l map 1; 


E» dig) 
.boot params 

.map io - 
Sot re = 200 Init beg, 
.timer = &ixdp2x01 timer, 


-init machine = ixdp2x01 init machine, 


10 MACHINE END 












































































































































& Oxfffc, 


























在 一 个 已 经 移植 好 OS 的 内 核 中 ， 驱 动工 程 师 完全 可 以 对 非常 规 内 存 区 域 的 WO 内 存 〈 外 设 
控制 器 寄存 器 、MCU 内 部 集成 的 外 设 控制 器 寄存 器 等 ) 依照 电 路 板 的 资源 使 用 情况 添加 到 map_ 
desc 数组 中 ， 代 码 清单 11.14 的 例子 给 出 了 内 存 空间 资源 的 使 用 情况 (注释 部 分 ) 与 map_desc 数 
组 的 对 应 关系 。 

代码 清单 11.14 ”根据 电路 板 内 存 资源 情况 定义 map desc 

Ts 

2 * 逻辑 地 址 物理 地 址 

3  * e8000000 40000000 PCI memory PHYS PCI MEM BASE (max 512M) 

4  * ec000000 61000000 PCI 配置 空间 ^ PHYS PCI CONFIG BASE (max 16M) 

5  * ed000000 62000000 PCI V3 regs PHYS PCI V3 BASE (max 64k) 

6  * ee000000 60000000 PCI IO PHYS PCI IO BASE (max 16M) 

A * ef000000 Cache flush 

8  * £1000000 0000000 核心 模块 寄存 器 

9  * f£1100000 1000000 系统 控制 寄存 器 

0 * f1200000 2000000 EBI 寄存 器 

1 * £1300000 3000000 计数 器 /定时 器 

2 * f1400000 4000000 中 断 控制 器 

3 * f1600000 6000000 UART 0 

4 * f1700000 7000000 UART 

5 * f1a00000 a000000 调试 用 LEDs 

6 * f1500000 5000000 GPIO 

gy a 

8 

9 static struct map desc ap io desc[] initdata = ( 

20 4 

Zi .virtual = IO ADDRESS (INTEGRATOR HDR BASE), 

22 .pfn = _ phys to pfn(INTEGRATOR HDR BASE), 

23 . length = SZ AK, 

24 .type - MT DEVICE 

28. lo 1 

26 .virtual = IO ADDRESS(INTEGRATOR SC BASE), 

2 .pfn = _ phys to pfn(INTEGRATOR SC BASE), 

zB .length = SZ AK, 

29 .type = MT DEVICE 

SO pi 

SL .virtual = IO ADDRESS(INTEGRATOR EBI BASE), 

32 .pfn = | phys to pfn(INTEGRATOR EBI BASE), 

S9 .length = SZ AK, 

34 .type = MT DEVICE 

SS. qo d 

36 .virtual = IO ADDRESS(INTEGRATOR CT BASE), 

ST .pfn = | phys to pfn(INTEGRATOR CT BASE), 

38 .length = SZ AK, 

39 .type - MT DEVICE 

ag. d 4 
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® 
41 .virtual = IO_ADDRESS (INTEGRATOR_IC_BASE), Q 
42 SOE = — phys. to p£n(INTEGRATOR IC BASE), 
43 .length = SZ AK, 
44 .type = MT DEVICE 
25 Ju s 
46 .virtual = IO ADDRESS (INTEGRATOR UARTO BASE), 
47 .pfn = | phys to pfn(INTEGRATOR UARTO BASE), 
48 . length = SZ_4K, 
49 .type = MT DEVICE 
930 TJ 4 
S .Virtual = IO ADDRESS (INTEGRATOR UART]1 BASE), 
52 .pfn = | phys to pfn(INTEGRATOR UART1 BASE), 
53 .length = SZ AK, 
54 .type - MT DEVICE 
59 ), ( 
56 .virtual = IO ADDRESS (INTEGRATOR DBG BASE), 
S SOEN = — phys. to p£n(INTEGRATOR DBG BASE), 
58 .length = SZ AK, 
59 .type = MT DEVICE 
90 Ja 4 
61 .virtual = IO ADDRESS (INTEGRATOR GPIO BASE), 
62 c joue —- | phys. to p£n(INTEGRATOR GPIO BASE), 
63 .length = SZ AK, 
64 .type = MT DEVICE 
GS Jig d 
66 .virtual = PCI MEMORY VADDR, 
67 .pfn = | phys to pfn(PHYS PCI MEM BASE), 
68 .length = SZ 16M, 
69 .type = MT DEVICE 
79 Y 1 
Ht .virtual = PCI CONFIG VADDR, 
I2 .pf£n = | phys to pfn(PHYS PCI CONFIG BASE), 
g .length = SZ 16M, 
74 .type = MT DEVICE 
wS jo o3 
76 .virtual - PCI V3 VADDR, 
TH BEN -omphyssStosptn(BHYSMPeTSV9 BASH), 
78 .length = SZ 64K, 
79 .type = MT DEVICE 
GONE ET 
81 .virtual - PCI IO VADDR, 
82 .pf£n - | phys to pfn(PHYS PCI IO BASE), 
83 .length = SZ 64K, 
84 .type = MT DEVICE 
95 Jg 
86 ); 
此 后 ， 在 设备 驱动 中 访问 经 过 map desc 数组 映射 后 的 IO 内 存 时 ， 直 接 在 map. desc 中 该 段 
的 虚拟 地 址 上 加 上 相应 的 偏 移 即 可 ， 不 再 需要 使 用 ioremap()。 
我 们 若 要 在 LDD6410 开发 板 的 板 文件 中 添加 新 的 物理 地 址 到 虚拟 地 址 的 映射 ， 只 需要 修改 
文件 /arch/arm/mach-s3c6410/mach-1dd6410.c 中 的 map. desc 数组 (目前 该 数组 为 空 
struct map desc ldd6410 iodesc[] = {}; 
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DMA 


DMA 是 一 种 无 需 CPU 的 参与 就 可 以 让 外 设 与 系统 内 存 之 间 进 行 双向 数据 传输 的 硬件 机 制 。 
使 用 DMA 可 以 使 系统 CPU 从 实际 的 IO 数据 传输 过 程 中 摆脱 出 来 ， 从 而 大 大 提高 系统 的 吞吐 
Z. DMA 通常 与 硬件 体系 结构 特别 是 外 设 的 总 线 技术 密切 相关 。 

DMA 方式 的 数据 传输 由 DMA 控制 器 (DMAC) 控制 ， 在 传输 期 间 ，CPU 可 以 并 发 地 执行 
其 他 任务 。 当 DMA 结束 后 ，DMAC 通过 中 断 通 知 CPU 数据 传输 已 经 结束 ， 然 后 由 CPU 执行 相 
应 的 中 断 服 务 程 序 进行 后 处 理 。 


11.6.1 DMA 与 Cache 一 致 性 

Cache 和 DMA 本 身 似 乎 是 两 个 毫 不 相关 的 事物 。Cache 被 用 做 CPU 针对 内 存 的 缓存 ， 利 用 
程序 的 空间 局 部 性 和 时 间 局 部 性 原理 ， 达 到 较 高 的 命中 率 从 而 避免 CPU 每 次 都 一 定 要 与 相对 慢 速 
的 内 存 交 互 数 据 来 提高 数据 的 访问 速率 。DMA 可 以 用 做 内 存 与 外 设 之 间 传 输 数 据 的 方式 ， 这 种 
传输 方式 之 下 ， 数 据 并 不 需要 经 过 CPU 中 转 。 
假设 DMA 针对 内 存 的 目的 地 址 与 Cache 绥 存 的 对 象 没有 重症 区 域 (如 图 11.10 所 示 ), DMA 
和 Cache 之 间 将 相安 无 事 。 但 是 ， 如 果 DMA 的 目的 地 址 与 Cache 所 缓存 的 内 存 地 址 访问 有 和 习 
(如 图 11.11 所 示 )， 经 过 DMA 操作 ，Cache 缓存 对 应 的 内 存 的 数据 已 经 被 修改 ， 而 CPU 本 身 
不 知道 ， 它 仍然 认为 Cache 中 的 数据 就 是 内 存 中 的 数据 ， 以 后 访问 Cache 映射 的 内 存 时 ， 它 仍然 
使 用 陈旧 的 Cache 数据 。 这 样 就 发 生 Cache 与 内 存 之 间 数 据 “不 一 致 性 ”的 错误 。 


È 目的 地 址 


内 存 
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11.10 DMA 目的 地 址 与 Cache 对 象 不 交叉 11.11 DMA 目的 地 址 与 Cache 对 象 交叉 











所 谓 Cache 数据 与 内 存 数据 的 不 一 致 性 ， 是 指 在 采用 Cache 的 系统 中 ， 同 样 一 个 数据 可 能 既 存 在 于 
Cache 中 ， 也 存在 于 主 存 中 ，Cache 与 主 存 中 的 数据 一 样 则 具有 一 致 性 ， 数 据 若 不 一 样 则 具有 不 一 致 性 。 
需要 特别 注意 的 是 ，Cache 与 内 存 的 一 致 性 问题 经 常 被 初学 者 遗忘 。 在 发 生 Cache 与 内 存 不 一 
致 性 错误 后 ， 驱 动 将 无 法 正常 运行 。 如 果 没 有 相关 的 背景 知识 ， 工 程 师 儿 乎 无 法 定位 错误 的 原因 ， 
因为 看 起 来 所 有 的 程序 都 是 完全 正确 的 。 
解决 由 于 DMA 导致 的 Cache 一 致 性 问题 的 最 简单 方法 是 直接 禁止 DMA 目标 地 址 范围 内 内 存 
的 Cache 功能 。 当 然 ， 这 将 牺牲 性 能 ， 但 是 却 更 可 靠 ， 图 11.12 所 示 为 Cache 和 DMA 在 考虑 性 能 和 
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易 用 两 个 方面 时 处 于 跷 跷 板 两 端的 比重 。 























易 用 
11.12 ” 跷 跷 板 两 端的 Cache 与 DMA 





闭 的 时 刻 。 例 如 ， 对 于 带 MMU 功能 的 ARM 处 理 器 ,在 开启 MMU 之 前 ， 需 要 先 置 Cache 


Cache 的 不 一 致 问题 并 非 只 是 发 生 在 DMA 的 情况 下 ,实际 上 ,还 存在 于 Cache 使 能 和 关 
F^ 无 效 , TLB 也 是 如 此 ， 代 码 清单 11.15 所 给 出 的 一 段 汇编 被 用 来 完成 此 任务 。 








代码 清单 11.15 Æ ARM 的 Cache 无 效 
/* 使 cache 无 效 */ 
"mov EU. S30Xn" 
"mcr  pl15, 0, r0, c7, c7, ONn"  /* 使 数据 和 指令 cache 无 效 */ 
"mor olb, 0, r0, c7, c10, 4Nn" /* pe Sen */ 
"mor oib, Or rO- 685» Cl 0Nn" * E mie sw E 


11.6.2 Linux 下 的 DMA 编程 
首先 DMA 本 身 不 属于 一 种 等 同 于 字符 设备 、 块 设备 和 网 络 设 备 的 外 设 ， 它 只 是 外 设 与 内 存 交 互 
数据 的 一 种 方式 。 因 此 ， 本 节 的 标题 不 是 “Linux 下 的 DMA 驱动 ”而 是 “Linux 下 的 DMA 编程 ”。 
内 存 中 用 于 与 外 设 交 互 数据 的 一 块 区 域 被 称 做 DMA 缓冲 区 ， 在 设备 不 支持 scatter/gather (43 
散 /聚集 ， 简 称 SG) 操作 的 情况 下 ，DMA 缓冲 区 必须 是 物理 上 连续 的 。 

1. DMA ZONE 

对 于 X86 系统 的 ISA 设备 而 言 ， 其 DMA 操作 只 能 在 16MB 以 下 的 内 存 中 进行 ， 因 此 ， 在 使 
用 kmalloc0 和 __get_free_pages0 及 其 类 似 函 数 申请 DMA 缓冲 区 时 应 使 用 GFP_DMA 标志 ， 这 样 能 
保证 获得 的 内 存 位 于 DMA_ZONE， 是 具备 DMA 能 力 的 。 

内 核 中 定义 了 __get_ free_pagesO 针 对 DMA 的 “快捷 方式 ” _get dma _ pages()， 它 在 申请 标志 


添加 了 GFP DMA， 如 下 所 示 : 
ddefine | get dma pages(gfp mask, order) \ 
. get free pages((gfp mask) | GFP DMA, (order)) 


如 果 不 想 使 用 logssize 即 order 为 参数 申请 DMA 内 存 ， 则 可 以 使 用 另 一 个 函数 dma mem 
alloc0， 其 源 代 码 如 代码 清单 11.16 所 示 。 


代码 清单 11.16 dma mem _alloc() 函 数 
1 static unsigned long dma mem alloc(int size) 
2 y 


(x gE (9 [eS de 
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3 int order = get order (size);/* 大 小 -> 指数 */ 
4 return |. get dma pages (GFP KERNEL, order); 
5-3 


对 于 大 多 数 现 代 骨 入 式 处 理 器 而 言 ，DMA 操作 可 以 在 整个 常规 内 存 区 域 进行 ， 因 此 DMA 
ZONE 就 直接 覆盖 了 常规 内 存 。 

2. 虚拟 地 址 ， 物 理 地 址 和 总 线 地 址 

基于 DMA 的 硬件 使 用 总 线 地 址 而 非 物理 地 址 ， 总 线 地 址 是 从 设备 角度 上 看 到 的 内 存 地 址 ， 
物理 地 址 则 是 从 CPU MMU 控制 器 外 围 角度 上 看 到 的 内 存 地 址 (从 CPU 核 角 度 看 到 的 是 虚拟 地 
HE). HERE PC E, XF ISA 和 PCI 而 言 ， 总 线 地 址 即 为 物理 地 址 ， 但 并 非 每 个 平台 都 是 如 此 。 
因为 有 时 候 接口 总 线 通过 桥接 电路 被 连接 ， 桥 接 电路 会 将 VO 地 址 映射 为 不 同 的 物理 地 址 。 例 如 ， 
在 PReP (PowerPC Reference Platform) 系统 中 ， 物 理 地 址 0 在 设备 端 看 起 来 是 0x80000000， 而 0 
通常 又 被 映射 为 虚拟 地 址 0xC0000000， 所 以 同一 地 址 就 具备 了 三 重 身份 : 物理 地 址 0、 总 线 地 址 
0x80000000 及 虚拟 地 址 0xC0000000。 还 有 一 些 系 统 提 供 了 页 面 映射 机 制 , 它 能 将 任意 的 页 面 映 射 
为 连续 的 外 设 总 线 地 址 。 内 核 提 供 了 如 下 函数 用 于 进行 简单 的 虚拟 地 址 /总 线 地 址 转换 : 


unsigned long virt to bus(volatile void *address); 
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void *bus to virt(unsigned long address); 
在 使 用 IOMMU 或 反弹 缓冲 区 的 情况 下 ， 上 述 函 数 一 般 不 会 正常 工作 。 而 且 ， 这 两 个 函数 并 不 建 
议 使 用 。 如 图 11.13 所 示 ，IOMMU 的 工作 原理 与 CPU 内 的 MMU 非常 类 似 ， 不 过 它 针对 的 是 外 设 总 
线 地 址 和 内 存 地 址 之 间 的 转化 。 由 于 IOMMU 可 以 使 得 外 设 DMA 引擎 看 到 “虚拟 地 址 ” 因此 在 使 
] IOMMU 的 情况 下 ， 在 修改 映射 寄存 器 后 ， 可 以 使 得 SG 中 分 段 的 缓冲 区 地 址 对 外 设 变 得 连续 。 
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11.13 MMU & IOMMU 


3. DMA ttika 

设备 并 不 一 定 能 在 所 有 的 内 存 地 址 上 执行 DMA 操作 ， 在 这 种 情况 下 应 该 通过 下 列 函数 执行 
DMA 地 址 掩 码 ; 

int dma set mask(struct device *dev, u64 mask); 

例如 ， 对 于 只 能 在 24 位 地 址 上 执行 DMA 操作 的 设备 而 言 ， 就 应 该 调用 dma set mask (dev, 
Oxfffffp) 。 

4. 一 致 性 DMA 缓冲 区 

DMA 映射 包括 两 个 方面 的 工作 : 分 配 一 片 DMA 缓冲 区 ; 为 这 片 缓冲 区 产生 设备 可 访问 的 地 
址 。 同 时 ，DMA 映射 也 必须 考虑 Cache 一 致 性 问题 。 内 核 中 提供 了 以 下 函数 用 于 分 配 一 个 DMA 
一 致 性 的 内 存 区 域 : 
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void * dma alloc coherent (struct device *dev, size t size, dma addr t *handle, gfp t gfp); 
上 述 函 数 的 返回 值 为 申请 到 的 DMA 缓冲 区 的 虚拟 地 址 ， 此 外 ， 该 函数 还 通过 参数 handle 3& 
回 DMA 缓冲 区 的 总 线 地 址 。handle 的 类 型 为 dma addr t， 代 表 的 是 总 线 地 址 。 
dma_alloc_coherent() 申 请 一 片 DMA 缓冲 区 ， 进 行 地 址 映射 并 保证 该 缓冲 区 的 Cache 一 致 性 
与 dma_alloc_coherentO 对 应 的 释放 函数 为 : 
void dma free coherent (struct device *dev, size t size, void *cpu addr, dma addr t handle); 
以 下 函数 用 于 分 配 一 个 写 合并 Cwritecombining) 的 DMA 缓冲 区 : 
void * dma alloc writecombine (struct device *dev, size t size, dma addr t *handle, gfp t gfp); 
与 dma alloc writecombineO 对 应 的 释放 函数 dma _ free. writecombine()Sz bs Eyii dma free | 
coherent()， 因 为 它 定 义 为 : 


#define dma free writecombine (dev,size,cpu addr,handle) \ 
dma free coherent (dev,size,cpu addr,handle) 


此 外 ，Linux 内 核 还 提供 了 PCI 设备 申请 DMA 缓冲 区 的 函数 pci alloc consistent), 3578973: 

void * pci alloc consistent(struct pci dev *pdev, size t size, dma addr t *dma addrp); 

对 应 的 释放 函数 为 pci free consistent), KEWA: 

void pci free consistent(struct pci dev *pdev, size t size, void *cpu addr, 
ama-addr.t dma addr)s 


5. 流 式 DMA 缓冲 区 

并 非 所 有 的 DMA 绥 冲 区 都 是 驱动 申请 的 ， 如 果 是 驱动 申请 的 ， 用 一 致 性 DMA 缓冲 区 自然 
最 方便 ， 直 接 考 虑 了 Cache 一 致 性 问题 。 但 是 ， 许 多 情况 下 ， 组 冲 区 来 自 内 核 的 较 上 层 〈 如 网 卡 
驱动 中 的 网 络 报 文 、 块 设备 驱动 中 要 写 入 设备 的 数据 等 )， 上 层 很 可 能 用 的 是 普通 的 kmalloc(). 
__get_free_pages0) 等 方法 申请 ， 这 时 候 就 要 使 用 流 式 DMA 映射 。 流 式 DMA 缓冲 区 使 用 的 一 般 步 
又 如 下 。 

(1) 进行 流 式 DMA 映射 。 

(2) 执行 DMA 操作 。 

(3) 进行 流 式 DMA 去 映射 。 
流 式 DMA 映射 操作 在 本 质 上 多 数 就 是 进行 Cache 的 invalidate 或 flush 操作 ， 以 解决 Cache 
一 致 性 问题 。 

相对 于 一 致 性 DMA 映射 而 言 ， 流 式 DMA 映射 的 接口 较为 复杂 。 对 于 单个 已 
区 而 言 ， 使 用 dma_map_single0 可 实现 流 式 DMA 映射 ， 该 函数 原型 为 : 


dma addr t dma map single(struct device *dev, void *buffer, size t size, 


ee 
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ER 


分 配 的 缓冲 



































enum dma data direction direction); 

ARRA AU], REAA RE, (0. RE NULL. 58 4 个 参数 为 DMA 的 方向 ， 可 能 
的 值 包括 DMA TO DEVICE. DMA FROM DEVICE, DMA BIDIRECTIONAL 和 DMA_NONE。 

dma map single() sc ER 2 7g dma_unmap_single()， 原 型 是 : 

void dma unmap single(struct device *dev, dma addr t dma addr, size t size, 


enum dma data direction direction); 
通常 情况 下 ， 设 备 驱动 不 应 该 访问 unmap 的 流 式 DMA 缓冲 区 ， 如 果 一 定 要 这 么 做 ， 可 先 使 
用 如 下 函数 获得 DMA 缓冲 区 的 拥有 权 : 


void dma sync single for cpu(struct device *dev, dma handle t bus. addr, 


































































































Size t size, enum dma data direction direction); 


在 驱动 访问 完 DMA 缓冲 区 后 ， 应 该 将 其 所 有 权 返 还 给 设备 ， 通 过 如 下 函数 完成 : 
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void dma sync single for device(struct device *dev, 
size t size, enum dma data direction direction); 





dma handle t 





3 


bus addr, 


如 果 设 备 要 求 较 大 的 DMA 缓冲 区 ， 在 其 支持 SG 模式 的 情况 下 ， 申 请 不 连续 的 多 个 相对 较 小 的 









































DMA 2X 


冲 














区 通常 是 防止 申请 太 大 的 连续 物理 


int dma map sg(struct device *dev, struct scatterlist *sg, int nents, 











enum dma data direction direction); 


nents 是 散 列 表 Cscatterlist?) 入口 
nents。 对 于 scatterlist 中 的 每 个 项 目 
MUTATA E KER. 


| 




















scatterlist 结构 体 的 定义 如 代码 清 襄 
缓冲 区 在 page ! 




















1 
2 
3 
4 
b 
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的 偏 移 〈offset)、 绥 冲 






































空间 的 方法 。 在 Linux 内 核 ! 


该 函数 的 返回 值 
，dma_map_sg() 为 设备 产生 恰当 的 总 线 地 址 ， 














， 使 








如 下 函数 映射 SG: 














是 DMA 缓冲 











Xx 的 数量 ， 





可 能 小 于 











代码 清单 11.17  scatterlist 结构 体 


struct scatterlist | 


struct page *page; 
unsigned int offset; 
dma addr t dma address; 
unsigned int length; 


}; 











执行 dma_map_sg0 后 ， 通 过 sg dma address() 可 返 


sg_dma_len() 可 返回 scatterlist 对 应 缓冲 
dma addr t s 











El] scatterlist 对 应 缓冲 














unsigned int sg dma len(struct scatterlist *sg); 


在 DMA 


void dma 














int nents, enum dma data direction direction); 


SG 








映射 属于 流 式 DMA 映射 ， 
定 要 访问 映射 情况 下 的 SG 缓冲 区 ， 应 该 先 调 





























与 单 











用 如 下 函数 











区 的 长 度 ， 这 两 个 函数 的 原型 为 : 


g dma address(struct scatterlist *sg); 


传输 结束 后 ， 可 通过 dma map sgOffJ/s KZ dma unmap sg0 去 除 DMA 映 


.unmap sg(struct device *dev, struct scatterlist *list, 


void dma sync sg for cpu(struct device *dev, struct scatterlist *sg, 


int nents, enum dma data direction direction); 


访问 完 后 ， 














通过 下 列 函数 将 所 有 权 返 下 





给 设备 : 












































物理 上 





它 会 合 





É 11.17 所 示 ， 它 包含 了 scatterlist 对 应 的 page 结构 体 指针 、 
区 长 度 (length〉 以 及 总 线 地 址 (dma_address)。 





区 的 总 线 地 址 ， 





Nm 
SE 


缓冲 区 情况 下 的 流 式 DMA 映射 类 似 ， 如 果 设 备 驱 动 一 


void dma sync sg for device(struct device *dev, struct scatterlist *sg, 


int nents, enum dma data direction direction); 


Linux 系统 中 可 以 有 一 个 相对 简单 的 方法 预先 分 配 缓冲 


例如 ， 对 于 内 存 为 64MB 的 系统 ， 
被 预 留 出 来 作为 VO 内 存 使 










































































6. 申请 和 释放 DMA 通道 
和 中 断 一样 ， 在 使 用 
通道 的 函数 如 下 : 

















同样 的 ， 设 备 结构 








DMA 之 前 ， 设 备 引 
































用 完 DMA 通 
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voi 








d free_dma (unsigned int 








道 后 ， 应 该 利 





























dmanr); 





现在 可 以 总 结 出 在 Linux 设备 驱动 中 DMA 相关 代码 


区 动 程序 需 首 4 














Ix 














， 那 就 是 同步 “mem=” 参 数 预 留 内 存 。 
通过 给 其 传递 mem-62MB 命令 行 参数 可 以 使 得 顶部 的 2MB 内 存 
], XX 2MB 内 存 可 以 被 静态 映射 (11.5 节 )， 也 可 以 被 执行 ioremap()。 























向 系统 申请 DMA 通道 ， 申 请 DMA 








int request dma(unsigned int dmanr, const char * device id); 
体 指 针 可 作为 传 入 device id 的 最 佳 参数 。 
用 如 下 函数 释放 该 通道 : 








如 图 11.14 所 示 。 








INUX 


内 存 与 uo 访问 e 





request. dma() 
并 初始 化 DMAC 


ee 






在 设备 驱动 模块 加 载 


或 open0 〇 函数 中 进行 
申请 DMA 缓冲 区 
ep 在 write 0 、read0 、 
Ca 
若 使 能 了 对 应 中 断 ， 进 行 
DMA 传输 后 的 中 断 处 理 | 中 听 处 理 程序 
释放 DMA 缓冲 区 
TEE BUSES AR E 
release () 函数 中 进行 


图 11.14 Linux 中 DMA 使 用 流程 
E 
Í Í o 总 结 


外 设 可 处 于 CPU 的 内 存 空间 和 UO 空间 ， 除 X86 外 ， 幅 入 式 处 理 器 一 般 只 存在 内 存 空间 。 
在 Linux 系统 中 ,为 IO 内 存 和 LO 端口 的 访问 提高 了 一 套 统一 的 方法 , 访问 流程 一 般 为 “ 申 i 
资源 一 映射 一 访问 一 去 映射 一 释放 资源 ”。 

对 于 有 MMU 的 处 理 器 而 言 ，Linux 系统 的 内 部 布局 比较 复杂 ， 可 直接 映射 的 物理 内 存 称 为 
常规 内 存 ， 超 出 部 分 为 高 端 内 存 。kmalloc0 和 _ get free pages() 申 请 的 内 存在 物理 上 连续 ， 而 
vmalloc() 申 请 的 内 存在 物理 上 不 连续 。 

DMA 操作 可 能 导致 Cache 的 不 一 致 问题 ， 因 此 ， 对 于 DMA 缓冲 ， 应 该 使 用 dma_alloc_coherent() 
等 方法 申请 。 在 DMA 操作 中 涉及 总 线 地 址 、 物 理 地 址 和 虚拟 地 址 等 概念 ， 区 分 这 3 类 地 址 非常 
EH., Linux 内 核 中 对 DMA 通道 的 申请 和 释放 采用 了 和 中 断 类 似 的 方法 
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前 面 数 章 我 们 看 到 了 globalmem. globalfifo 这 样 类 型 的 简单 的 字符 设 
备 驱 动 ， 但 是 ， 纵 观 Linux 内 核 的 源 代 码 ， 读 者 都 几乎 找 不 到 形式 如 此 简 
单 的 驱动 。 
在 实际 的 Linux 驱动 中 ,会 看 到 一 些 其 他 数据 结构 、API 和 设备 驱动 
的 一 些 新 特性 ， 因 此 ， 本 章 将 带领 您 走 入 真实 世界 里 的 设备 驱动 。 

12.1 全 面 介绍 了 platform 设备 和 驱动， 以 及 platform 的 意义 。 

12.2 WA 12.3 分别 分 析 了 Linux 设备 驱动 的 分 层 设计 思想 和 主机 与 外 
设 驱 动 分 离 的 设计 思想 ， 并 以 输入 设备 、RTC 设备 、SPI 主机 和 外 设 驱 动 
进行 了 例证 。 

12.4 节 介 绍 了 Linux 设备 驱动 的 电源 管理 , suspend() fll resume() 接 口 。 

12.5 节 介 绍 了 混杂 设备 miscdevice 驱动 。 

12.6 节 介 绍 了 基于 sysfs 的 驱动 。 

12.7 节 讲 解 了 设备 驱动 中 加 载 firmware 的 过 程 。 

12.8 节 对 Android 的 驱动 以 及 Android 引入 的 内 核 补丁 进行 了 介绍 。 
上 述 各 节 中 的 内 容 都 与 工程 实际 相关 ， 各 节 之 间 是 并 列 关 系 。 
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工程 中 的 Linux 设备 驱动 


1 2.1 platform 设备 驱动 


12.1.1 


platform 总 线 、 设 备 与 驱动 


f£ Linux 2.6 的 设备 驱动 模型 中 , 关心 总 线 、 设备 和 驱动 这 3 个 实体 ,总 线 将 设备 和 驱动 绑 定 。 

















在 系统 每 注册 一 个 设备 的 时 候 , 会 寻找 与 之 匹配 的 驱动 ; 相反 的 , 在 系统 每 注册 一 个 驱动 的 时 候 ， 

















会 寻找 与 之 匹配 的 设备 ， 而 匹配 由 总 线 完成 。 


















































一 个 现实 的 Linux 设备 和 了 驱动 通常 都 需要 挂 接 在 一 种 总 线 上 , 对 于 本 身 依附 于 PCI. USB, FC. 
SPI 等 的 设备 而 言 ， 这 自然 不 是 问题 ， 但 是 在 嵌入 式 系 统 里 面 ，SoC 系统 中 集成 的 独立 的 外 设 控 



















































































mla HERE SoC 内 存 空 间 的 外 设 等 确 不 依附 于 此 类 总 线 。 基 于 这 一 背景 ，Linux 发 明了 一 种 虚 











拟 的 总 线 ， 称 为 platform 总 线 ， 相 应 的 设备 称 为 platform_device， 而 驱动 成 为 platform_driver。 


E 














注意 , 所 谓 的 platform device 并 不 是 与 字符 设备 、 块 设备 和 网 络 设备 并 列 的 概念 , 而 是 Linux 






































系统 提供 的 一 种 附加 手段 ， 例 如 ， 在 S3C6410 处 理 器 中 ， 把 内 部 集成 的 PC、RTC、SPI、LCD、 




















看 门 狗 等 控制 器 都 归纳 为 platform_device， 而 它们 本 身 就 是 字符 设备 。platform_device 结构 体 的 























定义 如 代码 清单 12.1 所 示 。 


1 
2 
3 
4 
S 


6 
UNE. 








代码 清单 12.1  platform.device 结构 体 


struct platform device { 














const char * name; /* 设备 名 */ 

u32 ara 

struct device dev; 

u32 num resources; / * 设备 所 使 用 各 类 资源 数量 */ 
struct resource  * resource; /* XR */ 





platform driver 这 个 结构 体 中 包含 probe(). remove(). shutdown(). suspend(). resume() PAZ, 
































通常 也 需要 由 驱动 实现 ， 如 代码 清单 12.2 所 示 。 


























代码 清单 12.2 platform.driver 结构 体 


struct platform driver ( 


int (*probe) (struct platform device *); 

int (*remove) (struct platform device *); 

void (*shutdown) (struct platform device *); 

int (*suspend) (struct platform device *, pm message t state); 

int (*suspend late) (struct platform device *, pm message t state); 
int (*resume early) (struct platform device *); 

int (*resume) (struct platform device *); 

struct pm ext ops *pm; 

struct device driver driver; 
































73 platform 总 线 定 义 了 一 个 bus type 的 实例 platform bus type, 其 定义 如 代码 清单 12.3 所 示 。 





代码 清单 12.3 platform 总 线 的 bus.type 实例 platform.bus.type 


l struct bus type platform bus type - ( 


2 
3 


.name = "platform", 
Cey AT oe soplartform Clev evre iar 
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4 .match 

E .uevent 

6 .pm 

7); 

8 EXPORT SYMBOL GPL 
这 里 要 重点 关注 其 











= platform match, 


= platform uevent, 
= PLATFORM PM OPS PTR, 


























之 间 如 


Z| 


T 
2 1 
3 
4 
E 
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DN 























(platform bus type); 











match() 成 员 函 数 , 正 是 此 成 员 函 数 确定 了 platform device fll platform driver 
| 匹配， 如 代码 清单 12.4 所 示 。 











代码 清单 12.4  platform.bus.type 的 match() 成 员 函 数 














从 代码 清单 12.4 的 第 6 行 可 以 看 出 ， 











字段 是 否 相 同 。 


对 platform device 的 定义 通常 在 BSP 的 板 文件 中 实现 , 在 板 文件 中 , 将 platform. device 144 
为 一 个 数组 ， 最终 通过 platform_add_devices0 〇 函数 统一 注册 。platform_add_devices( 〇 函数 可 以 将 平 









































台 设 备 添加 到 系统 中 ， 这 个 函数 的 原型 为 : 


int platform add devices(struct platform device **devs, int num); 








该 函数 的 第 





一 个 参数 为 平台 








static int platform match(struct device *dev, struct device driver *drv) 
struct platform device *pdev; 


pdev = container of(dev, struct platform device, dev); 
return (strncmp(pdev-»name, drv-»name, BUS ID SIZE) == 0); 








ILHE platform device 和 platform driver 主要 看 两 者 的 name 






































设备 数组 的 指针 ， 第 二 个 参数 为 平台 设备 的 数量 ， 它 内 部 调用 了 
platform device register() FE ZH T 33:9] P PP Gr Re 




















12.1.2 ”将 globalfifo 作为 platform 设备 


现在 我 们 将 





前 面 章 


节 的 globalfifo J 





(1) 将 globalfifo 移植 为 paio IX 


(2) 在 板 文件 











中 添加 globalfifo 这 
为 完成 将 globalfifo 移植 到 platform 驱动 的 工作 ， 需 要 在 原始 的 globalfifo 字符 设备 驱动 中 套 
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DE 














区 动 挂 接 到 platform 总 线 上 ， 要 完成 两 个 工作 。 


个 platform 设备 。 



































一 层 platform_driver 的 外 过 ， 如 代码 清单 12.5。 注 意 进行 这 一 工作 后 ， 并 没有 改变 globalfifo 是 字 
符 设 备 的 本 质 ， 只 是 将 其 挂 接 到 了 platform 总 线 。 


代码 清单 12.5 X globalfifo 添加 platform.driver 


Statio 
{ 








int 























int ret; 
dev t devno = MKDEV(globalfifo major, 0); 




















/* 申请 设备 号 */ 
TI ouglopsltito menee) 
ret = register chrdev region(devno, 1, "globalfifo"); 


else 


} 














{ /* 动态 申请 设备 号 */ 




















J devinit globalfifo probe(struct platform device *pdev) 


ret eee chrdev cregionikdevno 0. 1, "globalfito"Uy: 
globalfifo major = MAJOR (devno); 


if (ret « 0) 


return ret; 
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eoo 





























i5 /* 动态 申请 设备 结构 体 的 内 存 */ 

16 globalfifo devp = kmalloc(sizeof(struct globalfifo dev), GFP KERNEL); 
i if (!globalfifo devp) (  /* 申 请 失败 */ 

18 ret = - ENOMEM; 

LS GOLO cari mellcep 

20 } 

2L 

22 memset(globalfifo devp, 0, sizeof(struct globalfifo dev)); 

29 

24 globalfifo setup cdev(globalfifo devp, 0); 

25 

26 init MUTEX(&globalfifo devp-»sem); ”/* 初 始 化 信号 量 */ 

27 init waitqueue head(&globalfifo devp-»r wait); /# 初 始 化 读 等 待 队列 头 */ 
28 init waitqueue head(&globalfifo devp-»w wait); /# 初 始 化 写 等 待 队列 头 */ 
29 

30 return 0; 

Sut 


32 fail malloc: unregister chrdev region(devno, 1); 











3/3] return ret; 

BAAN 

35 

36 static int | devexit globalfifo remove(struct platform device *pdev) 
Sq d 

38 cdev del(&globalfifo devp-»cdev); /*ikH8jcdev*/ 

39 kfree(globalfifo devp); /* 释 放 设 备 结构 体内 存 */ 

40 unregister chrdev region (MKDEV (globalfifo major, 0), 1); /* 释 放 设 备 号 */ 
41 return 0; 

Z2 y 

43 

44 static struct platform driver globalfifo device driver = { 

45 .probe = globalfifo probe, 

46 .remove =  devexit p(globalfifo remove), 

47 .driver = { 

48 . name = "globalfifo", 

49 .owner - THIS MODULE, 

50 } 

EX MEE 

512 

na edo de le ‘oe ee ni werd 

54 

55 return platform driver register(&globalfifo device driver); 
56 

57 

58 static void exit globalfifo exit (void) 

E 

60 platform driver unregister(&globalfifo device driver); 

61 

62 


63 module init(globalfifo init); 
64 module exit(globalfifo exit); 


在 代码 清单 12.5 中 ， 模 块 加 载 和 钊 载 函数 仅仅 通过 platform. driver register). platform driver - 
unregister0 函 数 进行 platform driver 的 注册 与 注销 ， 而 原先 注册 和 注销 字符 设备 的 工作 已 经 被 移交 
到 platform driver 的 probe) ll remove0 成 员 函 数 中 。 

代码 清单 12.5 未 列 出 的 部 分 与 原始 的 globalfifo 驱动 相同 ， 都 是 实现 作为 字符 设备 驱动 核心 
的 file operations 的 成 员 函 数 。 
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为 了 完成 在 板 文件 中 添加 globalfifo 这 个 platform 设备 的 工作 ， 需 要 在 板 文件 (对 于 LDD6410 
而 言 ， 为 arch/arm/mach-s3c6410/ mach-ldd6410.c) 中 添加 相应 的 代码 ， 如 代码 清单 12.6 所 示 。 









































代码 清单 12.6 ”globalfifo 对 应 的 platform.device 


1 static struct platform device globalfifo device = { 


2 .name = "globalfifo", 
3 miid - -1, 
4 





对 于 LDD6410 开发 板 而 言 ， 为 了 完成 上 述 globalfifo device 这 一 platform device 的 注册 ， 只 
需要 将 其 地 址 放 入 arch/arm/mach-s3c6410/ mach-1dd6410.c 中 定义 的 1dd6410 devices 数组 ， 如 : 


static struct platform device *1dd6410 devices[] initdata = ( 
十 & globalfifo device, 
ifdef CONFIG FB S3C V2 
&s3c device fb, 
endif 
&s3c device hsmmcO, 























在 加 载 LDD6410 驱动 后 ， 在 sysfs 中 会 发 现 如 下 结 点 : 
/sys/bus/platform/devices/globalfifo/ 
/sys/devices/platform/globalfifo/ 


留意 一 下 代码 清单 12.5 的 第 48 行 和 代码 清单 12.6 的 第 2 1T, platform. device 和 platform driver 
的 name 一 致 ， 这 是 两 者 得 以 匹配 的 前 提 。 


12.1.3 platform 设备 资源 和 数据 
留意 一 下 代码 清单 12.1 中 platform device 结构 体 定 义 的 第 5—6 行 ， 描 述 了 platform device 
的 资源 ， 资 源 本 身 由 resource 结构 体 描述 ， 其 定义 如 代码 清单 12.7 所 示 。 






















































































































































































代码 清单 12.7 resouce 结构 体 定 义 
EEUE pescupoe 1 
resource_ size_t start; 
resource_size_t end; 


unsigned long flags; 


al 

2 

3 

4 const char *name; 

5 

6 struct resource *parent, *sibling, *child; 
ij 


E 

我 们 通常 关心 start, end 和 flags 这 3 个 字段 ， 分 别 标明 资源 的 开始 值 、 结 束 值 和 类 型 ，flags 
可 以 为 IORESOURCE IO、IORESOURCE MEM, IORESOURCE IRQ、IORESOURCE DMA 等 。 
start, end 的 含义 会 随 着 flags 而 变更 ， 如 当 flags 为 IORESOURCE MEM 时 ，start、end 分 别 表示 
该 platform device 占据 的 内 存 的 开始 地 址 和 结束 地 址 ; 当 flags 为 IORESOURCE IRQ HT, start. 
end 分 别 表示 该 platform_ device 使 用 的 中 断 号 的 开始 值 和 结束 值 ， 如 果 只 使 用 了 1 个 中 断 号 ， 开 
始 和 结束 值 相同 。 对 于 同 种 类 型 的 资源 而 言 ， 可 以 有 多 份 ， 例 如 说 某 设 备 占据 了 2 个 内 存 区 域 ， 
则 可 以 定义 2 个 IORESOURCE MEM 资源 。 

对 resource 的 定义 也 通常 在 BSP 的 板 文件 中 进行 ， 而 在 具体 的 设备 驱动 中 透 过 platform_get_ 
resource() 这 样 的 API 来 获取 ， 此 API 的 原型 为 : 


struct resource *platform get resource (struct platform device *, unsigned int, unsigned int); 
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例如 在 LDD6410 开发 板 的 板 文件 中 为 DM9000 网 卡 定 义 了 如 下 resouce: 
Static struct resource ldd6410 dm9000 resource[] = { 
LOI LT 
.start - 0x18000000, 
.end = 0x18000000 + 3, 
.flags = IORESOURCE MEM 





oo 

















[3L] ee d 
.start = 0x18000000 + 0x4, 
.end = 0x18000000 * 0x7, 
.flags = IORESOURCE MEM 


Q2 - 4 
istas o TRONETNE( 0) UT 
sena = IRQ EINT(7), 
.flags - IORESOURCE IRO | IORESOURCE IRQ HIGHLEVEL, 


HH 
在 DM9000 网 卡 的 驱动 中 则 是 通过 如 下 办 法 拿 到 这 3 份 资源 : 

db-»addr res = platform get resource(pdev, IORESOURCE MEM, 0); 
db-»2data res = platform get resource(pdev, IORESOURCE MEM, 1); 
db-»irq res = platform get resource(pdev, IORESOURCE IRQ, 0); 


对 于 IRQ ifi. platform get resource0 还 有 一 个 进行 了 封装 的 变 体 platform get_irq()， 其 原 
7873: 

int platform get irq(struct platform device *dev, unsigned int num); 

它 实 际 上 调用 了 “platform_get resource(dev, IORESOURCE IRQ, num); ". 

设备 除了 可 以 在 BSP 中 定义 资源 以 外 ， 还 可 以 附加 一 些 数据 信息 ， 因 为 对 设备 的 硬件 描述 除 
了 中 断 、 内 存 、DMA 通道 以 外 ， 可 能 还 会 有 一 些 配置 信息 ， 而 这 些 配置 信息 也 依赖 于 板 ， 不 适 
宜 直 接 放 置 在 设备 驱动 本 身 ， 因 此 ，Pplatform 也 提供 了 platform data 的 支持 。platform_data 的 形 
式 是 自 定义 的 ， 如 对 于 DM9000 网 卡 而 言 ，platform_data 为 一 个 dm9000_plat data 结构 体 ， 我 们 
就 可 以 将 MAC 地 址 、 总 线 宽度 、 板 上 有 无 EEPROM 信息 等 放 入 platform. data: 

static struct dm9000 plat data ldd6410 dm9000 platdata = { 


.flags = DM9000 PLATE 16BITONLY | DM9000 PLATF NO EEPROM, 
.dev addr = ( 0x0, 0x16, Oxd4, Ox9f, Oxed, Oxa4 ], 





















































































































































































































































}; 


Static struct platform device 1dd6410 dm9000 = { 


. name= WO ON 

.id- op 

.num resources= ARRAY SIZE(1dd6410 dm9000 resource), 
.resource -1dd6410 dm9000 resource, 

.dev = { 


.platform data = &ldd6410 dm9000 platdata, 


而 在 DM9000 网 卡 的 驱动 中 ， 通 过 如 下 方式 就 拿 到 了 platform data: 
struct dm9000 plat data *pdata = pdev-»dev.platform data; 
其 中 ，pdev 为 platform device 的 指针 。 


以 上 分 析 可 知 ， 设 备 驱动 中 引入 platform 的 概念 
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少 有 如 下 两 大 好 处 。 
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(1) 使 得 设备 被 挂 接 在 一 个 总 线 上 ， 因 此 ， 符 合 Linux 2.6 的 设备 模型 。 其 结果 是 ， 配 套 的 
sysfs 结 点 、 设 备 电源 管理 都 成 为 可 能 。 
(2) 隔离 BSP 和 了 驱动。 在 BSP 中 定义 platform 设备 和 设备 使 用 的 资源 、 设 备 的 具体 配置 信息 ， 
而 在 驱动 中 ， 只 需要 通过 通用 API 去 获取 资源 和 数据 ， 做 到 了 板 相 关 代 码 和 驱动 代码 的 分 离 ， 使 
得 驱动 具有 更 好 的 可 扩展 性 和 跨 平台 性 。 



















































































































































































MA 设备 驱动 的 分 层 思想 


12.2.1 设备 驱动 核心 层 和 例 化 

在 面向 对 象 的 程序 设计 中 ， 可 以 为 某 一 类 相似 的 事物 定义 一 个 基 类 ， 而 具体 的 事物 可 以 继承 
这 个 基 类 中 的 函数 。 如 果 对 于 继承 的 这 个 事物 而 言 ， 其 某 成 员 函 数 的 实现 与 基 类 一 致 ， 那 它 就 可 
以 直接 继承 基 类 的 函数 ;相反 ， 它 可 以 重 载 之 。 这 种 面向 对 象 的 设计 思想 极 大 地 提高 了 代码 的 可 
能 力 ， 是 对 现实 世界 事物 间 关 系 的 一 种 良好 呈现 。 
Linux 内 核 完 全 由 C 语言 和 汇编 语言 写成 ， 但 是 却 频繁 用 到 了 面向 对 象 的 设计 思想 。 在 设备 
区 动 方面 ， 往 往 为 同类 的 设备 设计 了 一 个 框架 ， 而 框架 中 的 核心 层 则 实现 了 该 设备 通用 的 一 些 功 
能 。 同 样 的 ， 如 果 有 具体 的 设备 不 想 使 用 核心 层 的 函数 ， 它 可 以 重 载 之 。 举 个 例子 : 


return type core funca (xxx device * bottom dev, paraml type paraml, paraml type param2) 
( 




















luni 










































































a 
































H 


nm 

















































































































AE 







































































if (bottom dev-»funca) 
return bottom dev-»funca(paraml, param2); 
/* 核心 层 通用 的 funca 代码 */ 

































































ER core funca 的 实现 中 ， 会 检查 底层 设备 是 否 重 载 了 funca()， 如 果 重 载 了 ， 就 调用 底层 的 
人 代码， 否则， 直接 使 用 通用 层 的 。 这 样 做 的 好 处 是 ， 核 心 层 的 代码 可 以 处 理 绝 大 多 数 该 类 设备 的 
funca() 对 应 的 功能 ， 只 有 少数 特殊 设备 需要 重新 实现 funca()« 

再 看 一 个 例子 : 


return type core funca (xxx device * bottom dev, paraml type paraml, paraml type param2) 
( 























































































































/* 通 用 的 步骤 代码 A */ 


typea dev commonA(); 




















/* 底层 操作 ops1 */ 


bottom dev-»funca ops1(); 

















/* 通 用 的 步骤 代码 B */ 


typea dev commonB(); 














/* 底层 操作 ops2 */ 


bottom dev-»funca ops2(); 
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/* 通 用 的 步骤 代码 C */ 


typea dev commonB(); 





























oo 





/** 底层 操作 ops3 */ 
bottom dev-»funca ops3(); 
j 
上 述 代码 假定 为 了 实现 fnca0， 对 于 同类 设备 而 言 ， 操 作 流 程 一 致 ， 都 要 经 过 “通用 代码 A. 
底层 ops1、 通 用 代码 B、 底 层 ops2、 通 用 代码 C、 底 层 ops3” 这 几 步 ， 分 层 设计 明显 带 来 的 好 处 
是 ， 对 于 通用 代码 A、B、C， 有 具体 的 底层 驱动 不 需要 再 实现 ， 而 仅仅 只 关心 其 底层 的 操作 ops1、 
Ops2. ops3. 
图 12.1 明确 反映 了 设备 驱动 的 核心 层 与 具体 设备 驱动 的 关系 ,实际 上 ， 这 种 分 层 可 能 只 有 两 
Z (B 12.1 的 a)， 也 可 能 是 多 层 的 〈 图 12.1 的 b)。 
























































































































































































































A 类 设备 的 core 层 


A 类 设备 实例 1 A 类 设备 实例 2 A 类 设备 实例 3 





(a) 






A 类 设备 的 core 层 






A 类 设备 子 类 1 的 core A 类 设备 子 类 2 的 core 





A 类 设备 子 类 1 的 实例 1 A 类 设备 子 类 1 的 实例 2 A 类 设备 子 类 2 的 实例 1 


(b) 
12.4 Linux 设备 驱动 的 分 层 


这 样 的 分 层 化 设计 在 Linux Hf] input, RTC, MTD, PC, SPI, TTY, USB 等 诸多 设备 驱动 类 
型 中 屡见不鲜 。 下 面 的 两 小 节 以 input 和 RTC 为 例 先行 进行 一 番 讲 解 ， 当 然 ， 后 续 的 章节 会 对 几 
个 大 的 设备 类 型 对 应 驱动 的 层次 进行 更 详细 的 分 析 。 


12.2.2 输入 设备 驱动 

输入 设备 〈 如 按键、 键盘、 触摸屏、 鼠标 等 ) 是 典型 的 字符 设备 ， 其 一 般 的 工作 机 理 是 底层 
在 按键 、 触 摸 等 动作 发 送 时 产生 一 个 中 断 或 驱动 通过 timer 定时 查询 )， 然 后 CPU 通过 SPI. TC 
或 外 部 存储 器 总 线 读 取 键 值 、 坐 标 等 数据 ， 放 入 一 个 缓冲 区 ， 字 符 设 备 驱 动 管理 该 缓冲 区 ， 而 驱 
动 的 read0 接 口 让 用 户 可 以 读 取 键 值 、 坐 标 等 数据 。 
显然 ， 在 这 些 工 作 中 ， 只 是 中 断 、 读 键 值 /坐标 值 是 设备 相关 的 ， 而 输入 事件 的 缓冲 区 管理 以 
及 字符 设备 驱动 的 file operations 接口 则 对 输入 设备 是 通用 的 。 基 于 此 ， 内 核 设计 了 输入 子 系统 ， 
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里 公共 的 工作 。Linux 内 核 输入 子 系统 的 框架 如 图 12.2 所 示 。 





/dev/input/mice 





/dev/input/eventX 
/dev/input/js 控制 台 
Rd 
内 核 空间 
输入 核心 
ZOON 
虚拟 终端 


键盘 输入 











输入 设备 输入 事件 驱动 程序 
驱动 程序 er , joydev 
Ti 


TS 间 1 po LLL ee mM 
EM NT | | | | 
USB 鼠标 蓝牙 鼠标 SPI 


FRIT 
触摸 屏 控 制 





12.2 Linux 输入 设备 驱动 的 分 层 























输入 核心 提供 了 底层 输入 设备 驱动 程序 所 需 的 API， 如 分 配 /释放 一 个 输入 设备 : 
struct input dev *input allocate device (void); 
void input free device(struct input dev *dev); 


input allocate device0 返 回 的 是 1 个 input. dev 的 结构 体 ， 此 结构 体 用 于 表 





注册 /注销 


inb mus 









































IE 1 个 输入 设备 。 


E 











输入 设备 用 的 接口 如 下 : 


t check input register device(struct input dev *); 











void input unregister device(struct input dev *); 














报告 输入 事件 用 的 接口 如 下 : 

/* 报告 指定 type、code 的 输入 事件 */ 

void input event(struct input dev *dev, unsigned int type, unsigned int code, int value); 
/* 报告 键 值 */ 

void input report key(struct input dev *dev, unsigned int code, int value); 

/* 报告 相对 坐标 */ 


void input report rel(struct input dev *dev, unsigned int code, int value); 
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/* 报告 绝对 坐标 */ 

void input report abs(struct input dev *dev, unsigned int code, int value); 

/* 报告 同步 事件 */ 

void input sync(struct input dev *dev); 

而 所 有 的 输入 事件 ， 内 核 都 用 统一 的 数据 结构 来 描述 ， 这 个 数据 结构 是 input event, JE Wn 
码 清 单 12.8。 


eoo 


























MW ~ 















































代码 清单 12.8 input.event 结构 体 


1 struct input event { 

E struct timeval time; 
B WGE types 

4 . u16 code; 

9 . 832 value; 

6 





























drivers/input/keyboard/gpio keys.c 基于 input 架构 实现 了 一 个 通用 的 GPIO 按键 驱动 。 该 驱动 
基于 platform driver 架构 ， 名 为 “gpio-keys”。 它 将 硬件 相关 的 信息 (如 使 用 的 GPIO 号 ， 按 下 和 
抬 起 时 的 电 平 等 ) 屏蔽 在 板 文件 platform. device 的 platform data 中 ， 因 此 该 驱动 可 应 用 于 各 个 处 
理 器 ， 具 有 良好 的 跨 平 台 性 。 代 码 清单 12.9 列 出 了 该 驱动 的 probe0 函 数 。 


代码 清单 12.9. GPIO 按键 驱动 的 probe() ER 
























































































































































1 static int  devinit gpio keys probe(struct platform device *pdev) 
2 3 
3 struct gpio keys platform data *pdata = pdev-»dev.platform data; 
4 struct gpio keys drvdata *ddata; 
5 struct input dev *input; 
(9- beue. abe Gieo 
7 int wakeup = 0; 
8 
9 ddata = kzalloc(sizeof(struct gpio keys drvdata) 十 
0 pdata-»nbuttons * sizeof(struct gpio button data), 
i GFP KERNEL); 
12 input - input allocate device(); 
S; sn. herelevee [fp Timau) od 
4 error = -ENOMEM; 
5 COTO EE 
6] 
Jl 
8 platform set drvdata(pdev, ddata); 
9 





20 input-»name = pdev-»name; 

21 input-»phys - "gpio-keys/input0"; 
22 input-»dev.parent = &pdev-»dev; 
23 

24 input->id.bustype = BUS HOST; 

25 input-»id.vendor - 0x0001; 

26 input-»id.product - 0x0001; 

27 input-»id.version = 0x0100; 


28 

29 ddata-»input = input; 

30 

SL aeoe (Gb c Up. sb c to Sm ns 

32 struct gpio keys button *button - &pdata-»buttons[i]; 
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33 struct gpio button data *bdata = &ddata-»data[i]; 








34 Jaen 

35 unsigned int type - button-»type ?: EV KEY; 

36 

S bdata-»input - input; 

38 bdata-»button - button; 

39 setup timer(&bdata-»timer, 

40 gpio check button, (unsigned long)bdata); 
41 

42 

43 error - request irq(irg, gpio keys isr, 

44 IRQF SAMPLE RANDOM | IRQF TRIGGER RISING 
45 IRQF TRIGGER FALLING, 

46 button-»desc ? button-»desc : "gpio keys", 
47 bdata); 

48 (eae 4 

49 

50 } 

51 

52 if (button->wakeup) 

59 wakeup = 1; 

54 

55 input set capability(input, type, button-»code); 
So j 

ST 

58 error = input register device (input); 

ONES Erron) NET 

60 pr err("gpio-keys: Unable to register input device, 
61 Mn a ei en 

62 COCO a2 

$3 Jp 

64 


65 device init wakeup(&pdev-»dev, 
66 

eni return ok 

OMNE. 

GS 


wakeup); 








n 
















































































上 述 代码 的 第 12 行 分 配 了 1 个 输入 设备 , 第 20—27 行 初始 化 了 该 input_dev RE — + JE H 


A 
， 第 


PT 











58 行 注册 了 这 个 输入 设备 。 第 31 一 56 行 则 申请 了 此 GPIO 按键 设备 需要 的 : 
timer。 第 55 行 设置 此 输入 设备 可 告知 的 事情 。 
在 注册 输入 设备 后 ， 底 层 输入 设备 驱动 的 核心 工 
， 报 告 事件 。 代 码 清单 12.10 列 出 了 GPIO 按键 中 断 发 4 








只 剩 下 在 按键 、 
E 时 的 事件 报告 代码 。 

















断 号 ， 并 初始 化 了 


触摸 等 人 为 动作 发 生 的 时 








代码 清单 12.10 GPIO 按键 中 断 发 生 时 的 事件 报告 


{ 


struct input dev *input = bdata-»input; 
unsigned int type = button-»type ?: 
int state - 


100v 0 ame Co OS FX 


EV KEY; 


(gpio get value(button-»gpio) ? 1 : 0) 


struct gpio keys button *button = bdata-»button; 


static void gpio keys report event(struct gpio button data *bdata) 


^ button-»active low; 
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eoo 


8 input event(input, type, button-»code, !!state); 
9 input sync(input); 
j 


0 

1l 

2 static irqreturn t gpio keys isr(int irq, void *dev id) 
3 1 

4 struct gpio button data *bdata - dev id; 

5 struct gpio keys button *button = bdata-»button; 

6 
d 
8 


BUG ON(irq !- gpio to irq(button-»gpio)); 





9 if (button-»debounce interval) 


20 mod timer(&bdata-»timer, 

2 jiffies + msecs to jiffies (button-»debounce interval)); 
22 else 

259 gpio keys report event (bdata); 

24 

25 return IRQ HANDLED; 

ZION 

"m 


















































可 
SE 











第 8 行 是 报告 键 值 ， 而 第 9 行 是 1 个 同步 事件 ， 瞳 示 前 面 报告 的 消息 属于 1 个 消息 组 。 例 如 ， 
用 户 在 报告 完 X 坐标 后 ， 又 报告 Y 坐标 ， 之 后 报告 1 个 同步 事件 ， 应 用 程序 即 可 知道 前 面 报告 的 
X, Y 这 两 个 事件 属于 1 组 ， 它 会 将 两 者 联合 起 来 形成 1 个 X,Y) 的 坐标 。 

代码 清单 12.8 第 2 行 获 取 platform data, Tfj platform data 实际 上 是 定义 GPIO 按键 硬件 信息 
的 数组 ， 第 31 行 的 for 循环 工具 这 些 信息 申请 GPIO 并 初始 化 中 断 ， 对 于 LDD6140 电路 板 而 言 ， 
这 些 信 息 如 代码 清单 12.11。 
















































































山中 
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代码 清单 12.11 LDD6410 开发 板 GPIO 按键 的 platform.data 





1 static struct gpio keys button ldd6410 buttons[] -» ( 
2 { 
3 .gpio = S3C64XX GPEN(0), 
4 -Code = KEY DOWN, 
3) .desc = "Down", 
6 .active low = 1, 
7 ), 
SENT 
9 .gpio = S3C64XX GPN(1), 
0 .code = KEY ENTER, 
1l .desc = "Enter", 
2 .active low = 1, 
3 .Wakeup -], 
4j, 
9-1 
6 -gpio = S3C64XX GEN(2), 
qi .code = KEY HOME, 
8 .desc = "Home", 
Ei .active low = 1, 
20 fo 
2a 
22 -gpio = S3C64XX GEN(3), 
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2 .code = KEY POWER, 

24 .desc - "Power", 

25 .active_low = 1, 

26 .wakeup -], 

27 ]), 

25 d 

29 .gpio - S3C64XX GPN(4), 

30 .code = KEY TAB, 

Si .desc - "Tab", 

92 .active low- 1, 

SOM 

34 { 

35 .gpio = S3C64XX GEN(5), 

36 .code — KEY MENU, 

37 .desc - "Menu", 

38 .active low = 1, 

SINE, 

40 ]; 

41 

42 static struct gpio keys platform data ldd6410 button data - ( 
43 .buttons - 1dd6410 buttons, 

44 .nbuttons = ARRAY SIZE(l1dd6410 buttons), 
A5 VE 

46 

47 static struct platform device ldd6410 device button = { 
48 .name = "gpio-keys", 

49 cel cocus 

SO ele = i 

5L .platform data = &ldd6410 button data, 
B2. 

EN, 


12.2.3 RTC 设备 驱动 

RTC《〈 实 时 钟 ) 借助 电池 供电 ， 在 系统 掉 电 的 情况 下 时 间 依 然 可 以 正常 走动 。 它 通常 还 具 
有 产生 周期 性 中 断 以 及 产生 闭 钟 (alarm〉 中 断 的 能 力 ， 是 一 种 典型 的 字符 设备 。 作 为 一 种 字符 
设备 驱动 ，RTC 需要 有 file operations 中 接口 函数 的 实现 ， 如 open()、release()、read()、poll0、 
ioctl0 等 ， 而 典型 的 IOCTL 包括 RTC_SET_TIME、RTC ALM READ、 RTC ALM SET、 RTC_ 
IRQP SET. RTC IRQP READ 等 ， 这 些 对 于 所 有 的 RTC 是 通用 的 ， 只 有 底层 的 具体 实现 是 设 
备 相 关 的 。 
AE, drivers/rtc/rtc-dev.c 实现 了 RTC 驱动 通用 的 字符 设备 驱动 层 ,， 它 实现 了 file opearations 
的 成 员 函 数 以 及 一 些 关 于 了 RTC 的 通用 的 控制 代码 , 并 向 底层 导出 rte. device register(). rte. device - 
unregister() 用 于 注册 和 注销 RTC; 导出 rtc_class_ops 结构 体 用 于 描述 底层 的 RTC 硬件 操作 。 这 一 
RTC 通用 层 实 现 的 结果 是 , 底层 的 RTC 驱动 不 再 需要 关心 RTC 作为 字符 设备 驱动 的 具体 实现 ， 
也 无 需 关心 一 些 通 用 的 RTC 控制 逻辑 ， 图 12.3 表明 了 这 种 关系 。 

drivers/rtc/rtc-s3c.c 实现 了 S3C6410 的 RTC 驱动 ， 其 注册 RTC 以 及 绑 定 的 rtc class ops 的 代 
码 如 代码 清单 12.12 所 示 。 
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rtc class ops 





RTC 驱动 A RTC 驱动 B RTC 驱动 C 








12.3 Linux RTC 设备 驱动 的 分 层 


代码 清单 12.12. S3C6410 RTC 驱动 的 rtc.class.ops 实例 与 RTC 注册 





1 static const struct rtc class ops s3c rtcops = ( 

2 . open = s3c rtc open, 

5 .release = s3c rtc release, 

4 AOGE c Gee pt LOC Ely 

5 .read time = s3c rtc gettime, 

6 .Set time = s3c rto settime, 

3 .read alarm  - s3c rtc getalarm, 

8 .Set alarm = SSC CNSCi aa. 

9 .irq set freq = s3c rto setfreq, 

0 .irq set state —- s3c rtc setpie, 

T PROG ESO GRIGIO 

2 yg 

3 

4 static int s3c rtc probe(struct platform device *pdev) 
Sl 

6 

17 rtc = rtc device register("s3c", &pdev-»dev, &s3c rtcops, 
8 THIS MODULE); 

On 

POM 


12.3 主 宙 驱 动 与 外 设 驱动 分 离 思想 


12.3.1 主机 、 外 设 驱 动 分 离 的 意义 

在 Linux 设备 驱动 框架 的 设计 中 ， 除 了 有 分 层 设 计 实 现 以 外 ， 还 有 分 隐 
的 例子 ， 假 设 我 们 要 通过 SPI 总 线 访问 某 外 设 ， 在 这 个 访问 过 程 中 ， 要 通 
SPI 控制 器 的 寄存 器 来 达到 访问 SPI 外 设 YYY 的 目的 ， 最 简单 的 方法 是 : 


return type xxx write spi yyy(...) 
( 
































































































































XXV PES ESPINOSA C ERMEE (enge dL) c 
xxx_ write_spi_host_data_reg (buf); 
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while(!(xxx spi host status reg()&SPI DATA TRANSFER DONE)); 


} 

如 果 按 照 这 种 方式 来 设计 驱动 ， 结 果 是 对 于 任何 一 个 SPI 外 设 来 讲 ， 它 的 驱动 代码 都 是 CPU 
相关 的 。 也 就 是 说 ， 当 然 用 在 CPU XXX 上 的 时 候 ， 它 访问 XXX 的 SPI 主机 控制 寄存 器 ， 当 用 在 
XXXI 的 时 候 ， 它 访问 XXXI 的 SPI 主机 控制 寄存 器 

return type xxxl write spi yyy(...) 

{ 













































































pO: hub te Sp hose otri elton 
xxxl write spi host data reg (buf); 


while(!(xxx1 spi host status reg()&SPI DATA TRANSFER DONE)); 























这 显然 是 不 能 接受 的 ， 因 为 这 意味 着 外 设 YYY 用 在 不 同 的 CPU XXX 和 XXX1 上 的 时 候 需 
要 不 同 的 驱动 。 那 么 ， 我 们 可 以 用 如 图 12.4 所 示 的 思想 对 主机 控制 器 驱动 和 外 设 驱 动 进行 分 离 。 
这 样 的 结果 是 ， 外 设 a、b、c 的 驱动 与 主机 控制 器 A、B、C 的 驱动 不 相关 ， 主 机 控制 器 驱动 不 关 
心 外 设 ， 而 外 设 驱 动 也 不 关心 主机 ， 外 设 只 是 访问 核心 层 的 通用 的 API 进行 数据 传输 ， 主 机 和 外 
设 之 间 可 以 进行 任意 的 组 合 。 
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12.4 Linux 设备 驱动 的 主机 、 外 设 驱动 分 离 

















如 果 我 们 不 进行 如 图 12.4 MEAE A FRA a. b. c 和 主机 A、B、C 进行 组 合 
的 时 候 ， 需 要 9 个 不 同 的 驱动 。 设 想 一 共有 m 个 主机 控制 器 ，n 个 外 设 , 分 离 的 结果 是 需要 m+n 
个 驱动 ， 不 分 离 则 需要 m*n 个 驱动 。 
Linux SPI, PC, USB. ASoC (ALSA SoC) 等 子 系统 都 典型 地 利用 了 这 种 分 离 的 设计 思想 ， 
在 本 章 我 们 先 以 简单 一 些 的 SPI 为 例 ， 而 了 TC、USB、ASoC 等 则 在 后 续 章节 会 进行 详细 介绍 


12.3.2. Linux SPI 主机 和 设备 驱动 
SPI〈 同 步 外 设 接 口 ) 是 由 摩托 罗拉 公司 开发 的 全 双 工 同步 
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\ 线 ， 其 接口 由 MISO (上 串 行 


pun 
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数据 输入 )、MOSI (上 串 行 数据 输出 )、SCK (上 串 行 移 位 时 钟 )、SS( 从 使 能 信号 〉4 种 信号 构成 ， 
SS 决定 了 惟一 的 与 主 设备 通信 的 从 设备 ， 主 设备 通过 产生 移 位 时 钟 来 发 起 通信 。 通 信 时 ， 数 据 | 
MOSI 输出 ，MISO 输入 ,数据 在 时 钟 的 上 升 或 下 降 沿 由 MOSI 输出 , 在 紧 接 着 的 下 降 或 上 升 沿 ! 
MISO 读 入 ， 这 样 经 过 8/16 次 时 钟 的 改变 ， 完 成 8/16 位 数据 的 传输 。 

SPI 模块 为 了 和 外 设 进行 数据 交换 ， 根 据 外 设 工作 要 求 ， 其 输出 串 行 同步 时 钟 极 性 〈CPOL ) 
和 相位 (CPHA) 可 以 进行 配置 。 如果 CPOL= 0,， 串 行 同步 时 钟 的 空闲 状态 为 低 电 平 ; 如 果 CPOL= 1, 
串 行 同步 时 钟 的 空闲 状态 为 高 电 平 。 如 果 CPHA= 0， 在 串 行 同步 时 钟 的 第 一 个 跳 变 沿 (上 升 或 下 
降 ) 数据 被 采样 ， 如 果 CPHA = 1， 在 串 行 同步 时 钟 的 第 二 个 跳 变 沿 (上 升 或 下 降 ) 数据 被 采样 。 
SPI 接口 时 序 如 图 12.5 所 示 。 



















































































































































































































































































SCK 周期 7|SCK 周期 8 


SCK(CPOL-1) 


SCK(CPOL-0) 


MISI 











MISO 





SCK(CPOL-1) 


SCK(CPOL-0) 


MOSI 


MISO 














CPHA-1 时 SPI 总 线 数 据 传输 时 序 
12.5 SPI 总 线 时 序 
































在 Linux 中 ,用 代码 清单 12.13 的 spi master 结构 体 来 描述 一 个 SPI 主机 控制 器 驱动 ， 其 主要 
成 员 是 主机 控制 器 的 序号 〈 系 统 中 可 能 存在 多 个 SPI 主机 控制 器 )、 片 选 数量 、SPI 模式 和 时 钟 设 
置 用 到 的 函数 、 数 据 传输 用 到 的 函数 等 。 


代码 清单 12.13  spi.master 结构 体 







































































struct spi master ( 





2 struct device dev; 

3 SING bus num; 

4 ul6 num chipselect; 
5 
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6 /* 设置 模式 和 时 钟 */ 

y int (Se Ge (erruet. spi deyics eju) 

8 

9 /* 双向 数据 传输 */ 

10 die (*transfer) (struct spi device *spi, 

ibit struct spi message *mesg); 
T 

18 void (*cleanup) (struct spi device *spi); 

14. }; 





























分 配 、 注 册 和 注销 SPI 主机 的 API 由 SPI 核心 提供 : 


struct spi master * spi alloc master (struct device *host, unsigned size); 




















int spi register master(struct spi master *master); 
void spi unregister master(struct spi master *master); 


在 Linux 中 ， 用 代码 清单 12.14 的 spi driver 结构 体 来 描述 一 个 SPI 外 设 驱动 ， 可 以 认为 是 


spi master 的 client 驱动 。 



























































代码 清单 12.14 spi.driver 结构 体 


Se tS lr le 

2 int (*probe) (struct spi device *spi); 

3 ame (*remove) (struct spi device *spi); 

4 void (*shutdown) (struct spi device *spi); 

5 LNE (*suspend) (struct spi_device *spi, pm message_t mesg); 
6 ame (*resume) (struct spi_device *spi); 

F struct device_driver driver; 


SEES 
可 以 看 出 ，spi_driver 结构 体 和 platform. driver 结构 体 有 极 大 的 相似 性 ， 都 有 probe(). remove). 


suspend()、resume0 这 样 的 接口 。 是 的 ， 这 几乎 是 一 切 client 驱动 的 习惯 模板 。 
在 SPI 外 设 驱 动 中 ， 当 透 过 SPI 总 线 进行 数据 传输 的 时 候 , 使 用 了 一 套 与 CPU 无 关 的 统一 的 
接口 。 这 套 接口 的 第 1 个 关键 数据 结构 就 是 spi_transfer， 它 用 于 描述 SPI 传输 ， 如 代码 清单 12.15 












































































































































所 示 。 
代码 清单 12.15 spi.transfer 结构 体 
Ecc REST dE trans teri 
2 const void Vies Sep 
3 void ese OE 
4 unsigned len; 
5 
6 dma addr t tx dma; 
7 dma addr t rx dma; 
8 
9 unsigned csuchanmgesu 
0 u8 bits per word; 
T ul6 delay usecs; 
2 u32 Speed hz; 
3 
4 struct list head transfer list; 
5H 
而 一 次 完整 的 SPI 传输 流程 可 能 不 只 包含 一 次 spi transfer， 它 可 能 包含 一 个 或 多 个 



















































































spi_ transfer， 这 些 spi_transfer 最 终 通 过 spi_message 组 织 在 一 起 ， 其 定义 如 代码 清单 12.16 所 示 。 
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代码 清单 12.16 spi.message 结构 体 














1 struct spi message d 
2 struct list head transfers; 
B 
4 struct spi device *spi; 
5) 
6 unsigned is dma mapped:1; 
J/ 
8 /* 完成 被 一 个 callback 报告 */ 
9 void (*complete) (void *context); 
0 void boOnteescr 
unsigned actual length; 
2 int Status; 
3 
4 struct list head queue; 
5 void *state; 
(9-35 
通过 spi message_initO 可 以 初始 化 spi message， 而 将 spi transfer 添加 到 spi message 队列 的 
方法 则 是 : 











void spi message add tail(struct spi transfer *t, struct spi message *m); 

发 起 一 次 spi message 的 传输 有 同步 和 异步 两 种 方式 ， 使 用 同步 API 时 ， 会 阻塞 等 待 这 个 消 
息 被 处 理 完 。 同 步 操 作 时 使 用 的 API 是 : 
int spi sync(struct spi device *spi, struct spi message *message); 
使 用 异步 API 时 ， 不 会 阻塞 等 待 这 个 消息 被 处 理 完 ， 但 是 可 以 在 spi message 的 complete 字 
段 挂 接 一 个 回调 函数 ， 当 消息 被 处 理 完 成 后 ， 该 函数 会 被 调用 。 有 异步 操作 时 使 用 的 API 是 : 
int spi async(struct spi device *spi, struct spi message *message); 
尺码 清单 12.17 是 非常 典型 的 初始 化 spi_transfer、spi message 并 进行 SPI 数据 传输 的 例子 ， 
同时 它们 也 是 SPI 核心 层 的 两 个 通用 API, 在 SPI 外 设 驱 动 中 可 以 直接 调用 它们 进行 写 和 读 操作 。 
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代码 清单 12.17 SPI 传输 实例 spi.write(). spi.read() API 


Static inline int 
2 spi write(struct spi device *spi, const u8 *buf, size t len) 





S 
4 struct spi transfer t= { 
5 SC DIE = buf, 
6 .len = len, 
7 }; 
8 struct spi message m; 
g 
0 Spi message init(&m); 
4k Spi message add tail(&t, &m); 
2 return spi sync(spi, &m); 
3i 
4 


5 static inline int 
6 spi read(struct spi device *spi, u8 *buf, size t len) 





Hog 

8 struct spi transfer t= { 

9 Ph = buf, 
20 .len = len, 
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21 
2 
23 
24 
25 
26 
2E 


}; 


struct spi message m; 


Spi message init(&m); 
Spi message add tail(&t, &m); 
return spi sync(spi, &m); 








LDD6410 开发 板 所 使 用 的 S3C6410 的 SPI 主机 控制 器 驱动 位 于 drivers/spi/spi s3c.h. 和 
drivers/spi/spi s3c.c 这 两 个 文件 ， 其 主体 是 实现 了 spi master 的 setup()、transfer() 等 成 员 
SPI 外 设 驱 动 遍布 于 内 核 的 drivers. sound 的 各 个 子 目录 之 下 ，SPI 只 是 一 种 总 线 ，spi_driver 

















的 作用 只 是 将 SPI 外 设 挂 接 在 该 总 线 上 ， 因 此 在 spi driver 的 probe0 成 员 函 数 中 ， 将 注 
设 本 身 所 属 设备 驱动 的 类 型 。 
和 platform. driver 对 应 着 一 个 platform_device —fE, spi driver 也 对 应 着 一 个 spi device; platform | 
BSP 的 板 文件 中 添加 板 信息 数据 ,而 spi device 也 同样 需要 。spi_device 的 板 信息 用 
spi board info 结构 体 描述 ， 该 结构 体 记录 SPI 外 设 使 用 的 主机 控制 器 序号 、 片 选 序号 、 数 据 比特 
率 、SPI 传输 模式 〈 即 CPOL, CPHA) 等 。 如 诺基亚 770 上 两 个 SPI 设备 的 板 信息 数据 如 代码 清 
单 12.18， 位 于 板 文 件 arch/arm/mach-omap1/board-nokia770.c。 














device 需要 在 













































































































































































代码 清单 12.18 ”诺基亚 770 板 文件 中 的 spi.board.info 

































































Spi register board info(nokia770 spi board info, 


ARRAY SIZE(nokia770 spi board info)); 














这 一 点 和 启动 时 通过 platform_add_devices0 添 加 platform. device 非常 相似 。 





| 


一 个 真实 





2.4 设备 驱动 中 的 电源 管理 














册 SPI 外 









































1 static struct spi board info nokia770 spi board info[] | initdata - ( 
2 [Qi s i 
9 .modalias - "lcd mipid", 
4 .bus num = 2, /* 用 到 的 SPI 主机 控制 器 序号 */ 
5 .chip select = 3, /* 使 用 哪 一 号 片 选 */ 
6 .max speed hz = 12000000, /* SPI 数据 传输 比特 率 */ 
7 .platform data = &nokia770 mipid platform data, 
8 ), 
9 [EIE 
0 .modalias = "ads7846", 
Kis .bus num = 2, 
2 .chip_ select = 0, 
3 .max speed hz = 2500000, 
4 -irq = OMAP_GPIO_IRQ(15), 
5 .platform data = &nokia770 ads7846 platform data, 
6 ), 
Jl JE 
在 Linux 启动 过 程 中 ， 在 机 器 的 init machine0 函 数 中 ， 会 通过 如 下 语句 注册 这 些 spi board info: 



































生活 中 的 设备 驱动 除了 要 处 理 设 备 的 基本 功能 以 外 ， 还 需要 处 理 电 源 管理 ， 主 要 提 









































供 挂 起 和 恢复 

















的 suspend()、resume() 两 个 函数 ， 对 于 platform driver MA, ZAREZ 


已 经 包含 
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oo 


了 这 两 个 成 员 函 数 ， 包 含 suspend(). resume) A HKI platform. driver 一 般 形 如 代码 清单 12.19。 


代码 清单 12.19 包含 suspend/resume 的 platform.driver 


ifdef CONFIG PM 
static int xxx suspend(struct platform device *pdev, pm message t state) 


return 0; 


static int xxx resume(struct platform device *pdev) 





KC». 2004 TC OY cC oae ebur. POE 





0 
1 return 0; 

2 

3 #else 

4 4$define xxx suspend NULL 
5 4$define xxx resume NULL 
6 fendif 

X: 
8 


Static struct platform driver xxx driver - ( 





9 .probe = xxx probe, 
20 .remove = XXX remove, 
21 . suspend = xxx_suspend, 
22 . resume = xxx_resume, 
29 .driver = { 

24 .name kd 

28) .owner = THIS MODULE, 
26. yo 

2 Ms 

















上 述 代码 清单 中 ， 对 于 suspend()、resume() 进 行 了 CONFIG PM 宏 的 检查 ， 也 就 是 说 内 核 配 
置 了 电源 管理 的 情况 下 ， 才 定义 suspend0、resume0 的 实体 ， 否 则 将 它们 定义 为 NULL。 
通常 而 言 ， 在 suspend() 函 数 里 面 会 停止 设备 ， 并 关闭 给 它 提供 的 时 钟 ， 所 以 在 suspendo K žr 
里 面 经 常 看 见 这 样 的 语句 : 

clk disable (xxx-»clk); 


而 在 resume() 函 数 中 ， 进 行 相反 的 操作 : 


Clk enable (xxx-»clk); 

clk_disable()、clk_enable() 的 具体 实现 直接 依赖 于 SoC 的 类 型 ， 实 际 上 ， 在 BSP 内 为 SoC 内 
的 各 个 PLL、 分 频 器 和 时 钟 gate 建立 了 一 颗 树 ， 并 提供 了 一 组 操作 时 钟 的 通用 API。 因 此 ， 在 具 
体 的 设备 驱动 中 ， 最 好 不 要 直接 去 修改 寄存 器 来 操作 时 钟 ， 而 应 该 用 如 下 API: 

/* 获得 、 释 放 时钟 */ 


seruct el GEOEEEEEUCEECEVICEEOEEESTDSEECnST MS CN 





































































































































































































































































































vorei ehe ome (ee ee elk "eus E 


/* fEBB. ANRA */ 
int clk enable(struct clk *clk); 
void clk disable(struct clk *clk); 





/* 获得 、 试 探 和 设置 频率 */ 
unsigned long clk get rate(struct clk *clk); 
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long clk round rate(struct clk *clk, unsigned long rate); 


ipbos] 


[E TREES 
lk set parent(struct clk *clk, struct clk *parent); 
lk *clk get parent(struct clk *clk); 


É 12.2 中 platform driver 结构 体 的 定义 可 知 ， 它 除了 包含 suspend0 和 resume) A A 
以 外 ， 还 包含 如 下 两 个 入 口 : 


(*suspend late) (struct platform device *, pm message t state); 


aBeWE (e 
二 全 着 入 区 EN 


从 代码 清 六 


ace, 
Ie 
suspend late()5j suspend [X 5i] TE 
一 个 CPU 是 活跃 的 。 相 似 的 ，resume_early0 也 工作 于 中 断 都 被 禁止 的 情况 下 。 绝 大 多 数 情况 下 ， 
设备 驱动 不 提供 suspend_late0 和 resume early A HH. 




















XA SCNIPR */ 
































Visum ER 
miscdevice 结构 体 
DS1286 等 实时 钟 

miscdevice 252. 
设备 形成 一 个 链表 ， 对 设备 访问 时 内 核 根 所 
file_operations 结构 体 中 注 

在 内 核 中 ， 









































他 的 n. éé 等 等 » 
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12.20 所 示 。 


1 
2 
S 
4 
9 
6 


E 
8 


miscdevice 在 本 质 上 仍然 属于 字符 设备 ， 只 是 被 增加 了 一 层 封装 而 
作 还 是 file operations 的 成 员 函 数 。 代 码 清单 12.21 则 给 出 了 源 代 码 drivers/char/nvram.c. 所 实现 
NVRAM 驱动 的 miscdevice 和 file operations 实 


1 
2 
3 


struct miscdevice 


mney nt re 


const char *name; 





册 的 文件 操作 接口 
] struct miscdevice 结构 体 表 征 miscdevice 设备 ， 这 个 结构 体 的 定义 如 代码 清单 
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IPSI -设备 驱动 


Linux 包含 了 许多 的 设备 驱动 类 型 ， 而 不 
>o Œ Linux 里 面 ， 
WX). Linux 内 核 月 
、 字 符 LCD、AMD 768 随机 数 发 4 















































代码 清单 12.20 miscdevice 结构 体 


F, suspend late() L.fE T! 


As 


管 分 类 有 多 细 ， 总 会 有 些 ; 
把 无 法 归 类 的 五 花 八 门 的 设备 定义 为 混杂 设备 (用 
[提供 的 miscdevice 有 很 强 的 包容 性 ， 
E 嚣 等， 体现 了 大 杂烩 的 本 意 。 
主 设备 号 MISC_MAJOR〔( 即 10)， 但 次 设备 号 不 同 。 所 
时 次 设备 号 查找 对 应 的 miscdevice 设备 ， 然 后 调用 其 
进行 操作 。 





lk set rate(struct clk *clk, unsigned long rate); 





(*resume early) (struct platform device *); 











断 都 被 禁止 的 情况 下 ， 而 





































































































const struct file operations *fops; 
struct list head list; 
struct device *parent; 


struct device *this device; 


}; 





.owner - 
.llseek - 
.read - 





Mun 


























代码 清单 12.21 


nvram read, 



































NS 
nz 
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因此 其 
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NVRAM 设备 结构 体 


Static const struct file operations nvram fops = ( 
THIS MODULE, 
nvram llseek, 
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门 经 党 























如 NVRAM、 看 门 狗 、 


有 的 miscdevice 
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驱动 的 主体 工 
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oo 


5 .write = nvram write, 

6 Tocil - nvram ioctl, 

3 .open = nvram open, 

8 .release = nvram release, 
9 WE 

T 


11 static struct miscdevice nvram dev = { 
112 NVRAM MINOR, 


LS “nvram t; 
14 &nvram fops 
Jd 








对 misddevice 的 注册 和 注销 分 别 通过 如 下 两 个 API 完成 : 


int misc register(struct miscdevice * misc); 




















int misc deregister(struct miscdevice *misc); 
查看 drivers/char/nvram.c HRR IRRA ER pc n] AH, REREH f^ " misc register 
(&nvram dev);” 而 在 模块 卸载 时 调用 了 “misc_deregister(&nvram dev); ". 





















































1 2.6 基于 sysfs 的 设备 驱动 


本 身 没 有 对 应 的 /dev 结 点 ; 一 些 设备 驱动 虽然 有 对 应 的 



































一 些 设 备 驱动 以 sysfs 结 点 的 形式 存在 ， 
/dev 结 点 ， 也 依赖 于 sysfs 结 点 进行 一 些 工作 。 

Linux 专门 提供 了 一 种 类 型 的 设备 驱动 ， 以 结构 体 sysdev_driver 进行 描述 ， 该 结构 体 的 定义 如 代码 
清单 12.22 所 示 。 








































































































代码 清单 12.22 sysdev.driver 


1 struct sysdev driver ( 

2 struct list head entry; 

E int (*add) (struct sys device *); 

4 int (*remove) (struct sys device *); 

5 int (*shutdown) (struct sys device *); 

6 int (*suspend) (struct sys device *, pm message t state); 
7 int (*resume) (struct sys device *); 


8 DE 
注册 和 注销 此 类 驱动 的 API 为 : 


int sysdev driver register(struct sysdev class *, struct sysdev driver *); 


























void sysdev driver unregister(struct sysdev class *, struct sysdev driver *); 
而 此 类 驱动 中 通常 会 通过 如 下 两 个 API 来 创建 和 移 除 sysfs 的 结 点 : 


int sysdev create file(struct sys device *, struct sysdev attribute *); 
































void sysdev remove file(struct sys device *, struct sysdev attribute *); 


而 sysdev_create_file0) 最 终 调 用 的 是 sysfs create file(). sysfs create file 0 的 第 一 个 参数 为 kobject 的 
指针 , 第 二 个 参数 是 一 个 attribute 结构 体 , 每 个 attribute 对 应 着 sysfs 中 的 一 个 文件 , 而 读 写 一 个 attribute 
对 应 的 文件 通常 需要 show0 和 store0 这 两 个 函数 ， 形 如 : 


static ssize t xxx show(struct kobject * kobj, struct attribute * attr, char * buffer); 
























































static ssize t xxx store(struct kobject * kobj, struct attribute * attr, 


Sonst ehari Our ren ES ee COUE) 
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典型 的 ， 如 CPU 频率 驱动 cpufreq (EF drivers/cpufreq) 就 是 一 个 sysdev_driver 形式 的 驱动 ， 它 的 
主要 工作 就 是 提供 一 些 sysfs 的 结 点 ， 包 括 cpuinfo cur freq、cpuinfo max freq. cpuinfo min freq. scaling - 


























available frequencies. scaling available governors、scaling cur freq. scaling driver. scaling governor. 








scaling max freq. scaling min freq 等 。 用 户 空间 可 以 手动 cat. echo 来 操作 这 些 结 点 或 者 使 用 
cpufrequtils 工具 访问 这 些 结 点 以 与 内 核 通 信 。 

还 有 一 类 设备 虽然 不 以 sysdev_driver 的 形式 存在 ， 但 是 其 本 质 上 只 是 包含 sysfs 结 点 。 典 型 例子 包 
f&YC EEPROM， 它 以 FC Client 驱动 的 形式 存在 〈 后 续 章节 会 进行 介绍 ， 类 似 于 前 文 所 说 的 SPI 外 设 
驱动 )， 但 该 驱动 drivers/i2c/chips/eeprom.c 通过 sysfs create bin fle0 创 建 二 进 制 sysfs 文件 ， 该 二 进 制 
结 点 对 应 的 bin_attribute 如 代码 清单 12.23 所 示 。 

















































































































































































































代码 清单 12.23 EEPROM 驱动 的 bin.attribute 实例 

















1 static struct bin attribute eeprom attr - ( 

2 .attr = { 

3 .name = "eeprom", 

4 .mode = S IRUGO, 

5 ), 

6 .Size = 了 EEPROM SIZE, 

7 .read — eeprom read, 

CNET 

之 后 透 过 /sys 目录 里 的 “eeprom” 文 件 即 可 访问 该 EEPROM。 创 建 这 个 结 点 的 语句 是 ; 














Sysfs create bin file(&client-»5dev.kobj, &eeprom attr); 
中 第 1 7 UE bin attribute 所 对 应 设备 的 kobject 指针 ， 这 预示 着 该 “eeprom” 在 /sys 中 将 位 于 
client->dev 这 个 device 的 目录 之 下 。 
drivers/leds/ leds-gpio.c 的 基于 GPIO 的 LED 驱动 也 提供 了 sysfs 结 点 ， 针 对 此 驱动 ， 在 LDD6410 
的 板 文件 中 只 需要 定义 LED 对 应 的 GPIO 信息 并 作为 leds-gpio 这 个 platform_device BJ platform dat 即 可 ; 
Static struct gpio led l1dd6410 leds[] -» ( 





















































0] = { 

saama = WTD t, 

.gpio -» S3C64XX GPM(0), 
r 
ij = 

.name = "LED2", 

.gpio -» S3C64XX GPM(1), 
r 
2| = 


.name = "LED3", 
.gpio = S3C64XX GEM(2), 


.name = "LED4", 
.gpio = S3C64XX GPM(3), 





}; 


Static struct gpio led platform data l1dd6410 gpio led pdata -» ( 
.num leds = ARRAY SIZE(l1dd6410 leds), 
.leds = 1dd6410 leds, 
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Static struct platform device ldd6410 device led = { 

.name - "leds-gpio", 

cil = al; 

.dev = { 

.platform data = &1dd6410 gpio led pdata, 

), 
}; 
通过 如 下 命令 可 以 点 亮 LDD6410 右 下 角 的 LEDI: 
echo 1 > /sys/devices/platform/leds-gpio/ledsNV:LED1/brightness 
aK LEDI: 


echo 0 > /sys/devices/platform/leds-gpio/leds\:LED1/brightness 
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12.7 in 设备 驱动 的 固件 加 载 


一 个 外 设 的 运行 可 能 依赖 于 固件 ， 如 一 些 CSR 公司 的 WiFi 模块， 在 启动 前 需要 加 载 固件 。 传 统 的 
设备 驱动 将 固件 的 二 进 制 码 作为 一 个 数组 直接 编译 进 目 标 代 码 ， 而 在 Linux 2.6 中 ， 有 一 套 成 熟 的 固件 
加 载 流程 。 
首先 ， 申 请 固件 的 驱动 程序 发 起 如 下 请 求 : 
int request firmware(const struct firmware **fw, const char *name, struct device *device); 
第 1 个 参数 用 于 保存 申请 到 的 固件 ， 第 2 个 参数 是 固件 名 ， 第 3 个 参数 是 申请 固件 的 设备 结构 体 。 

在 发 起 此 调用 后 ， 内 核 的 udevd 会 配合 将 固件 通过 对 应 的 sysfs 结 点 写 入 内 核 〈 在 设置 好 udev 规则 
的 情况 下 )。 之 后 内 核 将 收 到 的 firmware 写 入 外 设 ， 最 后 通过 如 下 API 释放 请 求 : 

vold release firmware(const struct firmware *fw); 

下 面 看 一 个 典型 的 例子 drivers/media/video/cx25840/cx25840-firmware.c 的 cx25840 loadfw() ERG, 如 
代码 清单 12.24 所 示 。 
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代码 清单 12.24 Linux 设备 驱动 申请 firmware 的 例子 


int cx25840' Iloadfwistruüuct i12c client "chrent) 
































20 

3 struct cx25840 state *state = i2c get clientdata (client); 

4 const struct firmware *fw = NULL; 
5 u8 buffer[FWSEND]; 

6 Conca we tr 
T int size, retval; 

8 

9 if (state-»is cx23885) 

0 firmware = FWFILE CX23885; 

i /* 申请 firmware */ 

2 if (request firmware(&fw, firmware, FWDEV(client)) != 0) ( 
3 v4l err(client, "unable to open firmware So firmware); 
4 return -EINVAL; 

D } 

6 /* 开始 加 载 firmware 到 设备 */ 

F start_fw_load (client); 

8 
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S) buffer[0] = 0x08; 

20 buffer[1] = 0x02; 

Zu 

22 size = fw-»size; 

22 pobre me 

24 while (size > 0) t 

25 int len = min(FWSEND - 2, size); 
26 

2d memcpy (buffer + 2, ptr, len); 
28 

29 retval = fw writetclient, buffer, len + 2)3 
30 

SH (nS on ces 091 

32 release_firmware (fw); 
33 return retval; 

34 } 

25 

36 size -= len; 

ed ptr += len; 

dS l 

29 

40 end fw load(client); 

41 

42 size = fw-»size; 

43 /* 释放 firmware */ 

44 elease firmware(fw); 

45 

46 return check fw load(client, size); 
A 3 





1 2.8 Android 设备 驱动 


Android 的 设备 驱动 与 Linux — f 
引入 了 如 下 主要 补丁 。 

1. binder IPC 系统 

binder 机 制 是 Android 提供 的 一 种 进程 间 通 信 方 法 ， 使 一 个 进程 可 以 以 类 似 远 程 过 程 调用 的 
形式 调用 另 一 个 进程 所 提供 的 功能 ，LDD6410 开发 板 已 经 将 它 的 代码 移植 到 drivers/android/ 
binder.h、drivers/android/binder.c 下 面 ， 从 代码 清单 12.24 可 知 ， 它 就 是 一 种 典型 的 以 miscdevice 
形式 实现 的 字符 设备 ， 而 且 提 供 了 一 些 /proc 结 点 。 本 质 上 ，binder 用 户 空 间 的 程序 绝 大 多 数 情况 
下 在 底层 是 调用 了 binder 驱动 的 ioctl0 函 数 。 
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为 Android 本 身 基 于 Linux 内 核 ， 但 是 Android 对 内 核 
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代码 清单 12.25 Android binder 驱动 


Static struct file operations binder fops = ( 
.owner = THIS MODULE, 
.poll = binder poll, 





.unlocked ioctl - binder ioctl, 


.mmap = binder mmap, 


oh OT SS CO DY 


.open - binder open, 
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ET 
8 .release = binder release, 


oo 





9r WE 

0 

1 static struct miscdevice binder miscdev = { 

2 .minor = MISC DYNAMIC MINOR, 

3 .name - "binder", 

4 .fops - &binder fops 

Sr dg 

6 

qi Statr abc Init a > atate (GA eat) 

e 

oimne ret, 
20 
21 binder proc dir entry root - proc mkdir ("binder", NULL); 
22 if (binder proc dir entry root) 
2.3 binder proc dir entry proc - proc mkdir("proc", binder proc dir entry root); 
24 ret = misc register(&binder miscdev); 
Z5 3t onneks ne 
26 create proc read entry("state", S IRUGO, binder proc dir entry root, ...); 
2 create proc read entry("stats", S IRUGO, binder proc dir entry root, ...); 
28 create proc read entry("transactions", S IRUGO, ...); 

29 create proc read entry("transaction log", S IRUGO, ...); 

BO create proc read entry("failed transaction log", S IRUGO, ...); 

SI 

32 return ret; 


SEE 

Android 中 的 binder 通信 基于 Service/Client 模型 , 所 有 需要 IBinder 通信 的 进程 都 必须 创建 一 
个 IBinder 接口 。Android 虚拟 机 启动 之 前 系统 会 先 启 动 Service Manager 进程 ，Service Manager 
打开 binder 驱动 ,并 通知 binder 驱动 程序 这 个 进程 将 作为 System Service Manager， 然 后 该 进程 将 
进入 一 个 循环 ， 等 待 处 理 来 自 其 他 进程 的 数据 。 
而 在 用 户 程 序 方面 ，Service 端 创建 一 个 System Service 后 ， 通 过 defaultServiceManagerO 可 以 
得 到 远程 ServiceManager 的 接口 ， 通 过 这 个 接口 我 们 可 以 调用 addService0 函 数 将 新 的 System 
Service 添加 到 Service Manager 进程 中 。 对 于 Client 端 而 言 ， 则 可 以 通过 getService0 获 取 到 需要 
连接 的 目的 Service 的 IBinder 对 象 。 对 用 户 程 序 而 言 ， 获 得 这 个 对 象 后 就 可 以 通过 binder 驱动 访 
EJ Service 对 象 中 的 方法 。 
Client 与 Service 在 不 同 的 进程 中 ， 通 过 这 种 方式 实现 了 类 似 线程 间 的 迁移 的 通信 方式 ， 对 用 
户 程 序 而 言 当 调用 Service 返回 的 IBinder 接口 后 ， 访 问 Service 中 的 方法 就 如 同调 用 自己 的 函数 。 
两 个 进程 间 通 信 就 好 像 是 一 个 进程 进入 另 一 个 进程 执行 代码 然后 带 着 执行 的 结果 返回 。 

2. ashemem 内 存 共享 机 制 

ashmem 是 Android 新 增 的 一 种 内 存 分 配 / 共 享 机 制 ，LDD6410 开发 板 已 经 将 它 的 代码 移植 到 
mm/ashmem.c 下 面 。 从 代码 清单 12.26 可 知 , 它 也 是 一 种 典型 的 以 miscdevice 形式 实现 的 字符 设备 。 
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代码 清单 12.26 Android ashmem 驱动 


1 static struct file operations ashmem fops - ( 
2 .owner = THIS MODULE, 

3 .open = ashmem open, 

4 .release - ashmem release, 
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5 .mmap = ashmem mmap, 

6 .unlocked ioctl = ashmem ioctl, 
7 .compat ioctl - ashmem ioctl, 

9 Jg 

9) 

0 static struct miscdevice ashmem misc = { 
1 .minor = MISC DYNAMIC MINOR, 

2 .name = "ashmem", 

3 .fops = &ashmem fops, 

4 E 

5 
6 static int | init ashmem init(void) 

qi 
8 


{ 





20 ret = misc register(&ashmem misc); 
21 if (unlikely(ret)) ( 


2:9 return ret; 























































































































fd = open("/dev/ashmem", O RDWR); 
ioctl(fd, ASHMEM SET NAME, region name); 
ioctl(fd, ASHMEM SET SIZE, region size); 
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22 printk(KERN ERR "ashmem: failed to register misc device! Nn"); 


在 dev 目录 下 对 应 的 设备 是 /devwashmem， 相 比 于 传统 的 内 存 分 配 机 
名 mmap， 其 好 处 是 提供 了 辅助 内 核 内 存 回收 算法 的 pin/unpin BL 

ashmem 的 典型 用 法 是 先 打 开设 备 文件 ， 然 后 做 mmap 映射 。 

CD 通过 调用 ashmem create regionQ)PÉ GTI Iz Eb ashmem， 这 个 函数 的 实质 工作 为 ; 





amm. 


o 
































ASHMEM GET PIN STATUS 这 个 IOCTL 可 以 查询 pin 
3. Android 电源 管理 


射 的 空间 ， 以 提示 内 核 的 page cache 算法 可 以 把 哪些 页 盏 









































(2) 应 用 程序 一 般 会 调用 mmap 来 把 ashmem 分 配 的 空间 映射 到 ji 
mapAddr = mmap (NULL, pHdr->mapLength, PROT READ | PROT WRITE, MAP PRIVATE, fd, 0); 

应 用 程序 还 可 以 通过 ioctl)2€ pin CASHMEM PIN) 和 unpin CASHMEM UNPINO 某 一 段 映 
回收 ， 这 是 一 般 mmap 做 不 到 的 。 通 过 
的 状态 。 

















Android 电源 管理 针对 标准 Linux 内 核 的 电源 管理 
























































kernel/power/earlysuspend.c 
kernel/power/consoleearlysuspend.c 
kernel/power/fbearlysuspend.c 
kernel/power/wakelock.c 
kernel/power/userwakelock.c 


4. Android Low Memory Killer 









































drivers/android/lowmemorykiller.c 文件 。 


发 板 已 经 移植 到 了 kernel/power/ 目 录 ， 主 要 新 增 了 如 下 文件 : 


Linux 内 核 本 身 提供 了 OOM (Out Of Memory) HLH 
杀 死 进程 腾 出 内 存 。 不 过 Android 的 Low Memory Killer 相对 于 Linux 标准 OOM 机 
它 可 以 根据 需要 杀 死 进程 来 释放 内 存 。LDD6410 板 已 将 Low Memory Killer 移植 到 


1T J 





= 











c 








些 优化 ， 这 部 分 代码 LDD6410 F 





Bl, A] malloc、 匿 名 / 命 


























名 可 以 

















E 系 统 内 存 不 够 的 情况 下 主动 














判 更 加 灵活 ， 
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5. Android RAM console 和 |og 设备 

为 了 辅助 调试 ，Android 增加 了 用 于 将 内 核 打 印 消息 保存 起 来 的 RAM console 和 用 户 应 用 程 
序 可 以 写 入 、 读 取 log 信息 的 logger 设备 驱动 。 这 两 个 驱动 分 别 放置 在 drivers/android/ ram_console.c 
和 drivers/android/ logger.c 文件 。 

RAM console 通过 register_console() 被 注册 ， 关 于 这 个 接口 ， 本 书 第 14 章 会 进行 详细 介绍 ， 
而 logger 又 是 一 个 典型 的 miscdevice。 

6. Android alarm, timed gpio 等 。 

就 Android 系统 本 身 而 言 ， 在 其 上 编写 设备 驱动 没有 什么 神秘 的 ， 基 本 完全 按照 Linux 内 核 
本 身 的 框架 进行 。 而 Android 自身 引入 的 这 些 补 本 ， 曾 经 有 部 分 进入 过 Linux mainline 的 
drivers/staging 目录 ， 尔 后 由 于 缺少 维护 的 原因 ， 被 Greg KH 移 除 。 


IAS! = 


到 目前 为 上 ， 字 符 设 备 驱动 的 整个 讲解 就 暂时 划 上 了 一 个 名 号。 虽然 以 字符 设备 为 依托 进行 讲解 ， 
但 是 ， 第 6 一 11 章 中 所 描述 的 关于 阻塞 与 非 阻 塞 、 异 步 通知 、 轮 询 、 内 存 与 IO 访问 、 并 发 控制 等 机 
非 只 适用 于 字符 设备 ， 对 其 他 的 任何 设备 ， 都 存在 同样 的 问题 ， 也 采用 完全 相同 的 处 理 方法 。 
但 是 ， 真 实生 活 中 的 驱动 并 非 如 第 6—11 章 的 驱动 那 般 简洁 ， 它 往往 包含 了 platform、 分 层 、 
分 离 、miscdevice、sysfs、 电 源 管理 、 固 件 加 载 等 诸多 内 容 ， 因 此 ， 学 习 和 领悟 第 12 章 的 内 容 是 
我 们 将 驱动 的 理论 用 于 工程 开发 的 必要 环节 。 
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块 设备 是 与 字符 设备 并 列 的 概念 ， 这 两 类 设备 在 Linux 中 驱动 的 结构 
有 较 大 差异 ， 总 体 而 言 ， 块 设备 驱动 比 字符 设备 驱动 要 复杂 得 多 ， 在 IO 
操作 上 表现 出 极 大 的 不 同 ， 绥 冲 、IO 调度 、 请 求 队列 等 都 是 与 块 设备 驱 
力 相 关 的 概念 。 本 章 将 详细 讲解 Linux 块 设备 驱动 的 编程 方法 。 
13.1 节 讲 解 块 设备 VO 操作 的 特点 ， 分 析 字 符 设备 与 块 设备 在 IO 操 
Ie ENE Fe 
13.2 节 从 整体 上 描述 Linux 块 设备 驱动 的 结构 ,分 析 主 要 的 数据 结构 、 
函数 及 其 关系 。 
13.3—13.5 节 分 别 讲解 块 设备 驱动 模块 加 载 与 番 载 、 打 开 与 释放 和 
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ioctl() K Zt . 
13.6 节 非 常 重 要 ， 讲 述 了 块 设备 IO 操作 所 依赖 的 请 求 队列 的 概念 及 
用 法 。 








13.2 节 与 13.3—13.6 节 是 整体 与 部 分 的 关系 ,13.2 一 13.6 节 与 13.7 节 


是 迭代 弟 进 的 关系 。 
13.7 节 在 13.1—13.6 节 讲 解 内 容 的 基础 上 ， 总结 Linux 下 块 设备 的 读 
个 具体 实例 ， 即 vmem disk 的 驱动 。 









































写 流程 ， 实 现 了 块 设备 驱动 的 
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KR VO 操作 特点 


字符 设备 与 块 设备 IO 操作 的 不 同 如 下 。 

(OD 块 设备 只 能 以 块 为 单位 接受 输入 和 返回 输出， 而 字符 设备 则 以 字 节 为 单位 。 大 多 数 设备 
是 字符 设备 ， 因 为 它们 不 需要 缓冲 而 且 不 以 固定 块 大 小 进行 操作 。 

(2) 块 设备 对 于 VO 请 求 有 对 应 的 缓冲 区 ， 因 此 它们 可 以 选择 以 什么 顺序 进行 响应 ， 字 符 设 
备 无 须 缓冲 且 被 直接 读 写 。 对 于 存储 设备 而 言 调整 读 写 的 顺序 作用 巨大 ， 因 为 在 读 写 连续 的 扇 区 
比分 离 的 扇 区 更 快 。 

(3) 字符 设备 只 能 被 顺序 读 写 ， 而 块 设备 可 以 随机 访问 。 虽 然 块 设备 可 随机 访问 ， 但 是 对 了 
人 磁盘 这 类 机 械 设备 而 言 ， 顺 序 地 组 织 块 设备 的 访问 可 以 提高 性 能 ， 如 图 13.1 所 示 ， 对 扇 区 1、10、 











































































































































































































































































































3. 2 的 请 求 被 调整 为 对 扇 区 1. 2. 3. 10 的 请 求 。 而 对 SD 卡 、RamDisk 等 块 设备 而 言 ， 不 存在 
机 械 上 的 原因 ， 进 行 这 样 的 调整 没有 必要 。 
请 求 扇 区 1 请 求 扇 区 1 
请 求 扇 区 10 请 求 扇 区 2 
请 求 扇 区 3 — 请 求 扇 区 3 
请 求 扇 区 2 请 求 扇 区 10 
调整 前 调整 后 








13.1 调整 块 设备 1/0 操作 的 顺序 


Linux 块 设备 驱动 结构 


13.2.1 block_device_operations 结构 体 
在 块 设备 驱动 中 ， 有 一 个 类 似 于 字符 设备 驱动 中 file operations 结构 体 的 block device operations 
结构 体 ， 它 是 对 块 设 备 操作 的 集合 ， 定 义 如 代码 清单 13.1 所 示 。 


















































代码 清单 13.1 block. device. operations 结构 体 


1 struct block device operations { 

2 int (*open) (struct block device *, fmode t); 

3 int (*release) (struct gendisk *, fmode t); 

4 int (*locked ioctl) (struct block device *, fmode t, unsigned, unsigned long); 





INUX 








eoe 


273 





274 


Linux 设备 驱动 开发 详解 (第 2 版 ) 


fmode t, unsigned, unsigned long); 


(gb x. Sena leone E 


5 bae ea MENS ERU CENE le ve 

6 int (*compat ioctl) 

y int (*direct access) (se block device *, sector b, 
8 voi 

9 int (*media changed) (struct gendisk *); 


TO int (*revalidate disk) (struct gendisk *); 

wi int (*getgeo) (struct block device *, struct hd geometry *); 
1.27 struct module *owner; 

ES dep 





























1. 打开 和 释放 


int (*open) (struct gendis 
int (*release) (struct gen 


与 字符 设备 驱动 类 似 ， 当 设 
2. VO 控制 


ime (shox) (erruct lolo. 





下面 对 其 主要 的 成 员 函 数 进行 分 析 。 


k *disk, fmode t mode 


备 被 打开 和 关闭 时 将 调 





unsigned long arg); 














上 述 函 数 是 ioctl0 系 统 调用 和 








); 


disk *disk, fmode t mode); 








用 它们 。 








k device *bdev, fmode t mode, unsigned cmd, 








(struct block device *, fmode t, unsigned, unsigned long); 





的 实现 ， 块 设备 包含 大 量 的 标准 请 求 ， 这 些 标准 请 求 由 Linux 块 





设备 层 处理 ， 因 此 大 部 分 块 设备 驱动 的 ioctl0 函 数 相当 短 。 








3. 介质 改变 





int (*media changed) (struct gendisk *gd); 
























































这 个 函数 仅 适 用 于 支持 可 移动 介质 的 驱动 器 ， 通 常 需要 














的 标志 变量 ， 非 可 移动 设备 的 驱动 不 需要 实现 这 个 方法 











4. 使 介质 有 效 









































在 驱动 中 增加 一 个 表示 介 

















int (*revalidate disk) (struct gendisk *gd); 


revalidate_diskO 函 数 被 调用 来 响应 一 个 介质 改变 ， 它 给 驱动 一 个 机 会 来 进行 必要 的 工作 以 使 

















新 介质 准备 好 。 
5. 获得 驱动 器 信息 








o 


int (*getgeo) (struct block device *, struct hd geometry *); 


该 函数 根据 驱动 器 的 几何 信息 填充 一 个 hd. geometry 结构 体 , hd. geometry 结构 体 包 含 磁 头 、 














扇 区 、 柱 面 等 信息 ， 其 定义 于 include/linux/hdreg.h 头 文件 。 














6. 模块 指针 


struct module *owner; 

















被 内 核 调用 来 检查 是 否 驱 动 器 中 的 介质 已 经 改变 ， 如 果 是 ， 则 返回 一 个 非 0 值 ， 否 则 返回 0。 




















一 个 指向 拥有 这 个 结构 体 的 模块 的 指针 ， 它 通常 被 初始 化 为 THIS MODULE. 


13.2.2 gendisk 结构 体 











在 Linux 内 核 中 ， 使 用 gendisk OM) 
























































这 个 结构 体 的 定义 如 代码 清单 13.2 所 示 。 
代码 清单 13.2 gendisk 结构 体 





1 struct gendisk ( 

2 merna o 

3 aiae Eeee me 
4 int minors; 


yis 


t 





主 设备 号 */ 





最 大 的 次 设备 数 ， 如 果 不 能 





人 磁盘) 结构 体 来 表示 一 个 独立 的 磁盘 设备 (或 分 区 )， 





区 ， 则 为 1*/ 
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oec 









































3) 
6 char disk name[DISK NAME LEN]; /* 设备 名 称 */ 
F 
8 /* 由 partno 索引 的 分 区 指针 的 数组 
9 Ey 
0 Seubert "owe. ielouLo 
1 Si iene ECU tipan eO 
2 
3 struct block device operations *fops; /* 块 设备 操作 集合 */ 
4 struct request queue *queue; 
5 void *private_data; 
6 
qi amis, vee ve ie 
8 struct device *"driverfs dev; 7 FPFIXME: remóve 
9 struct kobject *slave dir; 
20 
2i struct timer rand state *random; 
22 
23 atomic t sync io; RATNER 
24 Struct work struct async notify; 
25 #ifdef CONFIG_BLK_DEV_INTEGRITY 
26 Sie Cm tee GT ey ee 
27 tendif 
28 int node id; 
CIONES 





major. first minor 和 minors 共同 表征 了 磁盘 的 主 、 次 设备 号 ， 同 一 个 磁盘 的 各 个 分 区 共享 一 
个 主 设备 号 ， 而 次 设备 号 则 不 同 。fops 为 block_device_operations， 即 上 节 描 述 的 块 设备 操作 集合 。 
queue 是 内 核 用 来 管理 这 个 设备 的 IO 请 求 队列 的 指针 。private_data 可 用 于 指向 磁盘 的 任何 私有 
数据 ， 用 法 与 字符 设备 驱动 file 结构 体 的 private data 类 似 。hd_struct 成 员 表示 一 个 分 区 ， 而 
disk_part_tbl 成 员 用 于 容纳 分 区 表 ，part0 和 part tbl 二 者 的 关系 在 于 : 

disk-»part tbl-spart[0] = &disk->part0; 

Linux 内 核 提供 了 一 组 函数 来 操作 gendisk， 如 下 所 示 。 

1. 分 配 gendisk 

gendisk 结构 体 是 一 个 动态 分 配 的 结构 体 , 它 需 要 特别 的 内 核 操 作 来 初始 化 ， 驱 动 不 能 自己 分 
配 这 个 结构 体 ， 而 应 该 使 用 下 列 函 数 来 分 配 gendisk: 

struct gendisk *alloc disk(int minors); 

minors 参数 是 这 个 磁盘 使 用 的 次 设备 号 的 数量 ， 一 般 也 就 是 磁盘 分 区 的 数量 ， 此 后 minors 不 
能 被 修改 。 

2. 增加 gendisk 

gendisk 结构 体 被 分 配 之 后 ， 系 统 还 不 能 使 用 这 个 磁盘 ， 需 要 调用 如 下 函数 来 注册 这 个 磁盘 设备 。 

void add disk(struct gendisk *disk); 
特别 要 注意 的 是 对 add_disk0 的 调用 必须 发 生 在 驱动 程序 的 初始 化 工作 完成 并 能 响应 磁盘 的 
请 求 之 后 。 

3. 释放 gendisk 

当 不 再 需要 一 个 磁盘 时 ， 应 当 使 用 如 下 函数 释放 gendisk. 


void del gendisk(struct gendisk *gp); 
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4. gendisk 引用 计数 
通过 get_disk0 和 put_disk() 函 数 可 用 来 操作 gendisk 的 引用 计数 , 这 个 工作 一 般 不 需要 驱动 亲 
自 做 。 这 两 个 函数 的 原型 分 别 为 : 


struct kobject *get disk(struct gendisk *disk); 












































void put disk(struct gendisk *disk); 
前 者 最 终 会 调用 “kobject_get(&disk_to_dev(disk)->kobj);”， 而 后 者 则 会 调用 “kobject_put 
(&disk to dev(disk)->kobj);”。 


13.2.3 request & bio 结构 体 
Ek 
在 Linux 块 设备 驱动 中 ， 使 用 request £& TA o RE EPEIETT HJ VO 请 求 ， 这 个 结构 体 的 定义 
如 代码 清单 13.3 所 示 。 




















































































































代码 清单 13.3 request 结构 体 


struct request { 






















































































2 struct list head queuelist; 

3 Struct call single data csd; 

4 menepi 

5 

6 struct request queue *qg; 

qi 

8 unsigned int cmd flags; 

9 enum rq cmd type bits cmd type; 

0 unsigned long atomic flags; 

1 

2 /* 维护 1/O submission 的 BIO 遍历 状态 

3 * hard 开头 的 成 员 仅 用 于 块 层 内 部 ， 驱 动 不 应 该 改变 它们 

4 

5 

6 sector t sector; /* 要 提交 的 下 一 个 sector */ 
y Sector t hard sector; /* 要 完成 的 下 一 个 sector */ 
8 unsigned long nr sectors; /* 剩余 需要 提交 的 sector 数 */ 
9 unsigned long hard nr sectors; /*# 剩 余 需要 完成 的 sector 数 */ 
20 /* 在 当前 segment 中 剩余 的 需 提 交 的 sector XX */ 

21 unsigned int current_nr_sectors; 

22 

23 /* 在 当前 segment 中 剩余 的 需 完成 的 sector 数 */ 

24 unsigned int hard cur sectors; 

25, 

26 Sieur Ie 

DT serice em ean 

28 

29 struct hlist node hash; 

30 union { 

31 struct rb node rb node; /* sort/lookup */ 

22 void *completion data; 

33 ; 

34 

35 fF 

36 * 1/0 调度 器 可 获得 的 两 个 指针 ， 如 果 需 要 更 多 ， 请 动态 分 配 
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27 ie 

38 void *elevator private; 
39 void *elevator private2; 
40 

41 struct gendisk *rq disk; 
42 unsigned long start time; 
43 

44 /* scatter-gather DMA 方式 下 addr-«len 对 的 数量 (执行 物理 地 址 合并 后 ) 
45 i 

46 unsigned short nr phys segments; 
47 

48 unsigned short ioprio; 

49 

50 void *special; 

51 char *buffer; 

52 

J3 HNE CECE 

54 EG 

39 

56 os i lh 

5 

58 unsigned short cmd len; 
59 unsigned char  cmd[BLK MAX CDB]; 
60 unsigned char *cmd; 

61 

62 unsigned int data len; 

63 unsigned int extra len; 
64 unsigned int sense len; 
65 void *data; 

66 void *sense; 

67 

68 unsigned long deadline; 
69 struct list head timeout list; 
70 unsigned int timeout; 

CUM int retries; 

72 

73 ps 

74 * 完成 回调 函数 

75 v 

76 rq end io fn *end io; 

Qr void *end io. data; 

7/8 

Je, struct request *next rg; 
80 }; 


request 结构 体 的 主要 成 员 包括 : 


sector t Nard sesto 








unsigned long hard nr sectors; 
unsigned int hard cur sectors; 


上 述 3 个 成 员 标 识 还 未 完成 的 肩 区 ，hard_sector 是 第 一 个 尚未 传输 的 肩 区 ，hard_nr_sectors 
是 尚 待 完成 的 肩 区 数 ，hard_cur_sectors 是 当前 VO 操作 中 待 完 成 的 扇 区 数 。 


Sei oT tt Sato 









































unsigned long nr_sectors; 





unsigned int current nr sectors; 


驱动 中 会 经 常 与 这 3 个 成 员 打 交道 ， 这 3 个 成 员 在 内 核 和 驱动 交互 中 发 挥 着 重大 作用 。 它 们 
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可 被 


phys 












































































































































以 512 字 节 大 小 为 一 个 扇 区 ， 如 果 硬 件 的 扇 区 大 小 不 是 512 字 节 ， 则 需要 进行 相应 的 调整 。 例 如 ， 
如 果 硬 件 的 忆 区 大 小 是 2048 字 节 ， 则 在 进行 硬件 操作 之 前 ， 需 要 用 4 来 除 起 始 扇 区 号 。 

hard sector. hard nr sectors. hard cur sectors 与 sector. nr sectors. current nr sectors 之 间 
可 认为 是 “副本 ”关系 。 

seriet ora MES OUS 

bio 是 这 个 请 求 中 包含 的 bio 结构 体 的 链表 ， 了 驱动 中 不 宜 直接 存 取 这 个 成 员 ，__rq_for_each_ 
bio( bio, rq) 宏 封装 了 对 bio 链表 的 遍历 方法 ， 其 定义 为 : 

ddefine | rq for each bio( bio, rq) N 

if ((rq>bio)) N 
iore (f lone = (Ge) oe Joop loo -— luo-oemu wesxs) 


char *buffer; 







































































指向 缓冲 区 的 指针 , 数据 应 当 被 传送 到 或 者 来 自 这 个 缓冲 区 , 这 个 指针 是 一 个 内 核 虚拟 地 址 ， 
驱动 直接 引用 。 

unsigned short nr phys segments; 

该 值 表 示 相 邻 的 页 被 合并 后 ， 这 个 请 求 在 物理 内 存 中 占据 的 段 的 数目 。 









































如 果 设 备 支 持 分 散 /聚集 (SG, scatter/gather) 操作 ， 本 
segments 的 内 存 ， 并 使 用 下 列 函 数 进 行 DMA 映射 : 


int blk rq map sg(struct request queue *, struct request *, struct scatterlist *); 
该 函数 与 dma_map_sg() 类 似 ， 它 返回 scatterlist 列表 入 口 的 数量 
struct list head queuelist; 

于 链接 这 个 请 求 到 请 求 队列 的 链表 结构 ，blkdev_dequeue _ requestO 可 用 了 
使 用 如 下 宏 可 以 从 request 获得 数据 传送 的 方向 。 
rq data dir(struct request *req); 
0 返回 值 表 示 从 设备 中 读 ， 非 0 返回 
2. 请 求 队列 

一 个 块 请 求 队列 是 一 个 块 /O request 


代码 清单 13.4 


依据 此 字段 申请 sizeof(scatterlist)* nr_ 


















































o 






































从 队列 ! 





余 请 求 。 


















































xn 








] 设 备 写 。 





















































的 队列 ， 其 定义 如 代码 清 
request 队列 结构 体 


É 13.4 所 示 。 








1 struct request queue { 

2 m 

3 request fn proc *request fn; 

4 make request fn *make request fn; 

5 prep rq fn *prep rq fn; 

6 unplug fn *unplug fn; 

7 prepare discard fn *prepare discard fn; 

8 merge bvec fn *merge bvec fn; 

9 prepare flush fn *prepare flush fn; 
0 softirq done fn *softirq done fn; 
1 rq timed out fn *rq timed out fn; 

2 dma drain needed fn *dma drain needed; 
3 lld busy fn *l1ld busy fn; 

4 "PT 

5 SEC . queue lock; 

6 spinlock t *queue lock; 

di 

8 fF 

9 * queue kobject 
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20 */ Q 

21 struct kobject kobj; 

22 

DE s 

24 * queue 设置 

I5 v 

26 unsigned long nr requests; /* Max 4 of requests */ 

27 unsigned int nr congestion on; 

28 unsigned int nr congestion off; 

219 unsigned int nr batching; 

30 

BA unsigned int max sectors; 

32 unsigned int max hw sectors; 

S3 unsigned short max phys segments; 

34 unsigned short max hw segments; 

B5 unsigned short hardsect size; 

36 unsigned int max segment size; 

33! 

38 unsigned long Seg boundary mask; 

39 void *dma drain buffer; 

40 unsigned int dma drain size; 

41 unsigned int dma pad mask; 

42 unsigned int dma alignment; 

43 

44 struct blk queue tag *queue tags; 

45 struct list head iere y Jojbtsisz LLSG 

46 

4] unsigned int nr sorted; 

48 unsigned int inctlptghte 

49 

50 unsigned int rq timeout; 

II Struct taimer TISE timeout; 

52 struct list head timeout list; 

53) 

54 ja 

5 NES aestus 

56 3, 

57 unsigned int sg timeout; 

58 unsigned int Sg reserved size; 

89 mE node; 

60 #ifdef CONFIG BLK DEV IO TRACE 

61 struct blk trace solk trace; 

62 #endif 

63 

64 }; 

请 求 队列 跟踪 等 候 的 块 LO 请 求 ， 它 存储 用 于 描述 这 个 设备 能 够 支持 的 请 求 的 类 型 信息 、 它 
们 的 最 大 大 小 、 多 少 不 同 的 段 可 进入 一 个 请 求 、 硬 件 扇 区 大 小 、 对 齐 要 求 等 参数 ， 其 结果 是 : 如 
果 请 求 队列 被 配置 正确 了 ， 它 不 会 交 给 该 设备 一 个 不 能 处 理 的 请 求 。 

请 求 队列 还 实现 一 个 插入 接口 ， 这 个 接口 允许 使 用 多 个 VO 调度 器 ，LO 调度 器 (也 称 电 梯 ) 
的 工作 是 以 最 优 性 能 的 方式 向 驱动 提交 VO 请 求 。 大 部 分 IO 调度 器 累积 批量 的 LO 请 求 ， 并 将 它 
们 排列 为 递增 (或 递减 ) 的 块 索引 顺序 后 提交 给 驱动 。 进 行 这 些 工作 的 原因 在 于 ， 对 于 磁头 而 言 ， 
当 给 定 顺 序 排列 的 请 求 时 ， 可 以 使 得 磁盘 顺序 地 从 一 头 到 另 一 头 工作 ， 非 常 像 一 个 满载 的 电梯 ， 
在 一 个 方向 移动 直到 所 有 它 的 “请 求 ”被 满足 。 

Jb. VO 调度 器 还 负责 合并 邻近 的 请 求 ， 当 一 个 新 VO 请 求 被 提交 给 调度 器 后 ， 它 会 在 队列 里 
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搜寻 包含 邻近 扇 区 的 请 求 。 如 果 找 到 一 个 ， 并 且 如 果 结 果 的 请 求 不 是 太 大 ， 调 度 器 将 合 





对 磁盘 等 块 设备 进行 VO 操作 顺序 的 调度 类 似 了 















































下 楼 的 乘客 效率 会 更 高 ， 而 顺序 响 
Linux 2.6 内 核 包 含 4 个 VO 调度 器 ， 它 们 
Deadline I/O scheduler Ej CFQ I/O scheduler. 
Noop I/O scheduler 是 一 个 简化 的 调度 程序 ， 该 算法 实现 了 
本 的 合并 与 排序 。 








— 








NH FE 


















































Anticipatory I/O scheduler 算法 # 


























次 请 求 的 延迟 降 至 最 低 ， 该 算法 重 排 


























提供 了 最 小 的 读 取 延迟 和 尚 佳 的 吞吐 量 








ER IO 请 求 ， 以 期 能 对 它们 进行 提 
每 次 处 理 完 读 请 求 之 后 ， 不 是 立即 返回 ， 而 是 等 待 几 个 微妙 。 在 这 段 时 


的 请 求 都 被 立即 执行 。 超 时 以 后 ， 继 续 原 来 的 处 理 。 








梯 的 原理 ， 先 服务 完 - 
的 请 求 则 电梯 会 无 序 地 忙乱 。 








个 简 























Deadline I/O scheduler 是 针对 Anticipatory I/O scheduler 的 缺点 进行 





























了 请 求 的 顺 


Fiy 

















应 该 使 


























内 核 block 目录 














kernel elevator-deadline 


(1) 初始 化 请 求 队列 。 








序 来 提高 性 能 。 它 使 ) 
特别 适合 于 读 取 较 多 的 环境 























CFQ I/O scheduler 为 系统 内 的 所 有 任务 分 碧 
荣 体 应 用 中 ， 









































均匀 的 IO 带宽 ， 提 供 
能 保证 audio. video 及 时 从 磁盘 读 取 数 据 。 
的 noop-iosched.c、as-iosched.c、deadline-iosched.c 和 cfq-iosched.c 文件 分 
别 实现 了 上 述 调度 算法 。 
可 以 通过 给 kernel 添加 启动 参数 ， 选 择 使 ) 











JH] IO 调度 算法 ， 如 : 














这 两 个 请 求 。 


上 楼 的 乘客 ， 再 服务 








分 别 是 No-op IO scheduler. Anticipatory IO scheduler. 





单 FIFO 队列 ， 它 只 作 最 基 


F 序 ， 获 得 最 高 的 效率 。 在 
| 间 内 ， 任 何 来 自 临近 区 域 














改善 而 来 的 ， 它 试图 把 每 











j 轮 询 的 调度 器 ， 简 洛 小 巧 ， 
《比如 数据 库 )。 


一 个 八 避 








人 公平 的 工作 环境 ， 在 


request queue t *blk init queue(request fn proc *rfn, spinlock t *lock); 

















该 函数 的 第 一 个 参数 是 请 求 处 理 函数 的 指针 ， 
个 函数 会 发 生 内 存 分 配 的 行为 ， 它 可 
设备 驱动 的 模块 加 载 函 数 中 调用 。 












































(2) 清除 请 求 队列 。 





能 会 


失败 ， 

















void blk cleanup queue (request queue t * q); 


这 个 函数 完成 将 请 求 队列 返回 给 系统 的 各 





而 blk_put_queue0 宏 则 定义 为 : 





FE 务 ， 一 般 在 块 设备 如 








ddefine blk put queue(q) blk cleanup queue((q)) 


(3) 分 配 “ 请 求 队列 ”。 





request queue t *blk alloc queue(int gfp mask); 





























对 于 Flash, RAM SEE ARENY E HE UBICA 
上 述 函 数 分 配 一 个 “请 求 队列 ”， 并 使 


(make_request_fn )。 






































第 二 个 参数 是 控制 访问 队列 权限 的 自 


因此 一 定 要 检查 它 的 返回 











值 。 这 个 函数 一 般 在 块 














区 动 模 块 外 载 函数 中 调用 。 


不 需要 进行 复 
] 如 下 函数 来 绑 定 请 求 队列 和 “第 























杂 的 VO 调度 ， 这 个 时 候 ， 





fA 


造 请 求 ”函数 


void blk queue make request(request queue t * q, make request fn * mfn); 





在 13.62 节 我 们 会 看 到 ， 这 种 方式 分 配 的 “请 求 队列 ”实际 上 不 包含 人 
加 上 引号 。 


(4) 提取 请 求 。 








struct request *elv next request(struct request queue *q); 


























EXS EG 200] 

















返回 下 








个 要 处 理 的 请 求 〈 























E 何 request， 所 以 给 ] 


A 


LO 调度 器 决定 )， 如 果 没 有 请 求 则 返回 NULL。 
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elv_next_request() 不 会 清除 请 求 ， 它 仍然 将 这 个 请 求 保留 在 队列 上 , 但 是 标识 它 为 活动 的 ， 这 个 标 
识 将 阻止 VO 调度 器 合并 其 他 的 请 求 到 已 开始 执行 的 请 求 。 因为 elv_next_request() 不 从 队列 
里 清除 请 求 ， 因 此 连续 调用 它 两 次 ， 两 次 会 返回 同一 个 请 求 结 构 体 。 

(50 去 除 请 求 。 

void blkdev dequeue request(struct request *req); 
上 述 函 数 从 队列 中 去 除 一 个 请 求 。 如 果 驱 动 中 同时 从 同一 个 队列 中 操作 了 多 个 请 求 ， 它 必须 
以 这 样 的 方式 将 它们 从 队列 中 去 除 。 

如 果 需 要 将 一 个 已 经 出 列 的 请 求 归还 到 队列 ， 以 进行 以 下 调用 : 

void elv requeue request(request queue t *queue, struct request *req); 

另外 ， 块 设备 层 还 提供 了 一 套 函 数 ， 这 些 函数 可 被 驱动 用 来 控制 一 个 请 求 队列 的 操作 ， 主 要 
包括 以 下 操作 。 

(6) 启 停 请 求 队列 。 


void blk stop queue(request queue t *queue); 





oo 













































































































































































uH 


















































void blk start queue(request queue t *queue); 

如 果 块 设备 到 达 不 能 处 理 等 候 的 命令 的 状态 ， 应 调用 blk _stop_queue() 来 告知 块 设备 层 。 之 后 ， 
请 求 函数 将 不 被 调用 ， 除 非 再 次 调用 blk_start_queue() 将 设备 恢复 到 可 处 理 请 求 的 状态 。 

CD 参数 设置 。 


void blk_dueue_max_sectors (request queue t *queue, unsigned short max); 





































































































void blk queue max phys segments (request queue t *queue, unsigned short max); 
void blk queue max hw segments (request queue t *queue, unsigned short max); 


void blk queue max segment size(request queue t *queue, unsigned int max); 

这 些 函 数 用 于 设置 描述 块 设 备 可 处 理 的 请 求 的 参数 。blk_queue_max_sectors0 描 述 任 一 请 求 可 包 
含 的 最 大 扇 区 数 ， 默 认 值 为 255; blk queue max phys segments()fll blk queue max hw. segments) ff 
空 制 一 个 请 求 中 可 包含 的 最 大 物理 段 〈 系 统 内 存 中 不 相 邻 的 区 )，blk_ queue_max_hw_segments0 考 虑 
了 系统 IO 内 存 管理 单元 的 重 映 射 ， 这 两 个 参数 缺 省 都 是 128。blk_ queue max segment size 告知 
内 核 请 求 段 的 最 大 字 节 数 ， 默 认 值 为 65536。 

(80 通告 内 核 。 

void blk queue bounce limit(request queue t *queue, u64 dma addr); 

该 函数 用 于 告知 内 核 块 设备 执行 DMA 时 可 使 用 的 最 高 物理 地 址 dma_addr， 如 果 一 个 请 求 包 
含 超 出 这 个 限制 的 内 存 引 用 ， 系 统 将 会 给 这 个 操作 分 配 一 个 “反弹 ”缓冲 区 。 这 种 方式 的 代价 晶 
贵 ， 因 此 应 尽量 避免 使 用 。 
可 以 给 dma_addr 参数 提供 任何 可 能 的 值 或 使 用 预先 定义 的 宏 , 如 BLK. BOUNCE HIGH (对 
高 端 内 存 页 使 用 反弹 缓冲 区 )、BLK_BOUNCE ISA〔 了 驱动 只 可 在 16MB ÉI ISA 区 执行 DMA) 或 
者 BLK BOUCE ANY 驱动 可 在 任何 地 址 执行 DMA), BE BLK BOUNCE HIGH. 

blk queue segment boundary(request queue t *queue, unsigned long mask); 
如 果 我 们 正在 驱动 编写 的 设备 无 法 处 理 跨越 一 个 特殊 大 小 内 存 边 界 的 请 求 ， 应 该 使 用 这 个 函 
数 来 告知 内 核 这 个 边界 。 例 如 ， 如 果 设 备 处 理 跨 4MB 边界 的 请 求 有 困难 ， 应 该 传递 一 个 0x3fffff 
JEI, A HPE E 0xffffffff (对 应 4GB 边界 )。 

void blk queue dma alignment (request queue t *queue, int mask); 
告知 内 核 块 设备 施加 于 DMA 传送 的 内 存 对 齐 限制 ， 所 有 请 求 都 匹配 这 个 对 齐 ， 缺 省 的 屏蔽 
是 0xlff， 它 导致 所 有 的 请 求 被 对 齐 到 512 字 节 边界 。 






















































































IN 
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void blk queue hardsect size(request queue t *queue, unsigned short max); 

TA ERU ARR AL E e UU d DCN. PMA E PHA AE BUSES RICCA EO BLA 
正确 对 界 。 但 是 ， 内 核 块 设备 层 和 驱动 之 间 的 通信 还 是 以 512. 字 节 扇 区 为 单位 进行 。 

3. HR I/O 
通常 一 个 bio 对 应 一 个 上 层 传递 给 块 层 的 IO 请 求 ， 代 码 清单 13.5 给 出 了 bio 结构 体 的 定义 。 
VO 调度 算法 可 将 连续 的 bio 合并 成 一 个 request. request 是 bio 经 由 块 层 进行 调整 后 的 结果 , 这 是 
request 和 bio 的 区 别 。 所 以 ， 一 个 request 可 以 包含 多 个 bios 


代码 清单 13.5 bio 结构 体 


















































































































































































































































1 St renet queri 
2 sector t bi sector; /* 要 传输 的 第 一 个 扇 区 */ 
3 struct ibio ee 
4 struct block device*bpi bdev; 
5 unsigned long bi flags; /* 状态 、 命 令 等 */ 

6 unsigned long bi rw; /* 低位 表示 READ/WRITE， 高 位 表示 优先 级 */ 
T 

8 unsigned short bi vcnt; /* bio vec 数量 */ 

9 unsigned short bi idx; /* 当前 bvl_vec 索引 */ 

0 

1 /* 执行 物理 地 址 合并 后 sgement 的 数目 */ 

2 unsigned short bi phys segments; 

3 

4 unsigned int bi size; 

5 

6 /* 为 了 明了 最 大 的 segment 尺寸 ， 我 们 考虑 这 个 bio 中 第 一 个 和 最 后 一 个 
7 可 合并 的 segment 的 尺寸 */ 

8 unsigned int bi hw front size; 

9 unsigned int bi hw back size; 
20 
2i unsigned int bi max vecs; /* 我 们 能 持 有 的 最 大 bvl vecs 数 */ 
22 unsigned int bi comp cpu; /* completion CPU */ 
26) 
24 struct bio vec *bi io vec; /* 实际 的 vec 列表 */ 
25 
26 bio end io t *bi Eme io; 
21 atomice E Di ent; 
28 
29 void *bi private; 
30 #if defined(CONFIG BLK DEV INTEGRITY) 
31 struct bio integrity payload *bi integrity; /* 数据 完整 性 */ 
32 #endif 
29 
34 bio destructor t *bi destructor; /* 析 构 */ 
S5. Jg 

















下 面 我 们 对 其 中 的 核心 成 员 进行 分 析 : 

sector ono 

标识 这 个 bio 要 传送 的 第 一 个 C512 FW) HX 

unsigned int bi size; 

被 传送 的 数据 大 小 ， 以 字 节 为 单位 ， 驱 动 中 可 以 使 用 bio_sectors(bio) 宏 获得 以 扇 区 为 单位 的 大 小 ， 
该 宏 实际 定义 为 “((bio)->bi_size >> 9)". 


unsigned long bi flags; 



























































unsigned long bi rw; 


一 组 描述 bio 的 标志 ， 如 果 这 是 一 个 写 请 求 ，bi_rw 最 低 有 效 位 被 置 位 ， 可 以 使 用 bio_data_ 
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dir(bio) 宏 来 获得 读 写 方向 ， 该 宏 实际 定义 为 “((bio)->bi_rw & 1)". 
bio 的 核心 是 一 个 称 为 bi io vec 的 数组 ， 它 由 bio vec 结构 体 组 成 ，bio_vec 结构 体 的 定义 如 
代码 清单 13.6 所 示 。 





























代码 清单 13.6 bio.vec 结构 体 
i struct biocvec 1 
2 struct page *bv page; /* 页 指针 */ 
3 unsigned int bv len; /* 传输 的 字 节 数 */ 
4 unsigned int bv offset; /* 偏 移 位 置 */ 
5j 


我 们 不 应 该 直接 访问 bio 的 bio vec 成 员 , 而 应 该 使 用 bio_for_each_segment() 宏 来 进行 这 项 工 
作 ， 可 以 用 这 个 宏 循环 遍历 整个 bio 中 的 每 个 段 ， 这 个 宏 的 定义 如 代码 清单 13.7 所 示 。 


代码 清单 13.7 bio. for. each. segment ZZ 




































































1 4$define bio for each segment(bvl, bio, i, start idx) MN 
2 sor Qov = Jouer aeneo abs (ono) (nues adeb) y. oe agb p. N 
3 i « (bio)-»bi vont; N 

4 bvltt, ic4) 

5 

6 4define bio for each segment(bvl, bio, i) X 

5 EmbUoNRoncachwsegnmentiovil Mo oO) ue bo) 








图 13.2 Ca) 所 示 为 request 队列 、request 与 bio 数据 结构 之 间 的 关系 ，13.2 CbO 所 示 为 request. 
bio 和 bio vec 数据 结构 之 间 的 关系 ，13.2 Ce) 所 示 为 bio 与 bio vec 数据 结构 之 间 的 关系 ， 因 此 
整个 图 13.2 递归 地 呈现 了 request 队列 、request、bio 和 bio vec 这 4 个 结构 体 之 间 的 关系 。 
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II back merge. fn 
II front merge fn 





II merge requests. fn 
\| generic plug device 





Ca) request 5j bio 





INUX 283 





Linux 设备 驱动 开发 详解 (第 2 版 ) 
















bi next 





bio 












elevator type ra 






request 





bv. page 


bio vec bio vec 


(b) request. bio fil bio vec 


bi io vec 





(c) bio 5j bio vec 


13.2 request KAJ], request, bio 和 bio vec 结构 体 之 间 的 关系 











内 核 还 提供 了 一 组 函数 ( 宏 〉 用 于 操作 bio: 

dme oa GU ee oe oe) 

这 个 函数 可 用 于 获得 数据 传输 的 方向 是 READ 还 是 WRITE。 

struct page *bio page(struct bio *bio) ; 

这 个 函数 可 用 于 获得 目前 的 页 指针 。 

ne | (OMe eee oe oto) 

这 个 函数 返回 操作 对 应 的 当前 页 内 的 偏 移 ， 通 常 块 LO. 操作 本 身 就 是 页 对 齐 的 。 
ne oe ee Seen (me ee I lot > 

这 个 函数 返回 当前 bio_vec 要 传输 的 扇 区 数 。 


char *bio data(struct bio *bio) ; 
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这 个 函数 返回 数据 缓冲 区 的 内 核 虚拟 地 址 。 
char *bvec kmap .irq(struct bio.vec *bvec, unsigned long *flags) ; 
这 个 函数 返回 一 个 内 核 虚拟 地 址 ， 这 个 地 址 可 用 于 存 取 被 给 定 的 bio. vec 入 口 指向 的 数据 缓冲 区 。 
它 也 会 屏蔽 中 断 并 返回 一 个 原子 kmap〔( 用 于 高 端 内 存 映射 )， 因 此 ， 在 bvec_kunmap_irq0 被 调用 以 前 ， 
驱动 不 应 该 睡眠 。 
void bvec kunmap irq(char *buffer, unsigned long *flags); 
这 个 函数 是 bvec kmap irq()PA ZH “RAA, 它 撤 销 bvec_kmap_irqO 创 建 的 映射 。 
char *bio kmap irq(struct bio *bio, unsigned long *flags); 
这 个 函数 是 对 bvec_kmap_irq0 的 包装 ， 它 返回 给 定 的 bio 的 当前 bio vec 入 口 的 映射 。 


char 





































































































. bio kmap atomic(struct bio *bio, int i, enum km type type); 

这 个 函数 通过 kmap_atomic() 获 得 返回 给 定 bio 的 第 i 个 缓冲 区 的 虚拟 地 址 。 

void . bio kunmap atomic(char *addr, enum km type type); 

这 个 函数 返还 由 _bio kmap_atomic0O 获 得 的 内 核 虚拟 地 址 。 

需要 注意 的 是 ，xx_kmap_xx、xx_kunmap xx 系列 函数 针对 的 是 支持 高 端 内 存 的 驱动 。 
另外 ， 对 bio 的 引用 计数 通过 如 下 宏 / 函 数 完成 : 

define bio get (bio) atomic inc(&(bio)-»bi cnt) 

void bio put(struct bio *bio); /* 释放 对 bio 的 引用 */ 


如 下 函数 用 于 在 内 核 中 向 块 层 提交 一 个 BIO: 


二 
结合 使 用 bio_get0、submit bio0、bio_put0 的 流程 一 般 是 : 
bio get (bio); 
submit bio(rw, bio); 
adr Noro 2 ec) 
do something 
bio put (bio); 


13.2.4 块 设备 驱动 注册 与 注销 

块 设备 驱动 中 的 第 一 个 工作 通常 是 注册 它们 自己 到 内 核 ， 完 成 这 个 任务 的 函数 是 register 
blkdev()， 其 原型 为 : 

int register blkdev (unsigned int major, const char *name); 

major 参数 是 块 设备 要 使 用 的 主 设 备 号 ，name 为 设备 名 ， 它 会 在 /proc/devices 中 被 显示 。 如 
R major X 0, 内核 会 自动 分 配 一 个 新 的 主 设备 写 , register_blkdev() 函 数 的 返回 值 就 是 这 个 主 设备 
号 。 如 果 register_blkdev0 返 回 一 个 负 值 ， 表 明 发 生 了 一 个 错误 。 

与 register_blkdev() 对 应 的 注销 函数 是 unregister_blkdev()， 其 原型 为 : 

int unregister blkdev(unsigned int major, const char *name); 
这 里 ,传递 给 register_blkdev0O 的 参数 必须 与 传递 给 register blkdev f] Z ZUG WO, AUA K 
数 返 回 -EINVAL。 
值得 一 提 的 是 ， 在 Linux 2.6 内 核 中 ， 对 register_blkdev0 的 调用 完全 是 可 选 的 ，register_blkdev0 
的 功能 已 随时 间 正 在 减少 ， 这 个 调用 最 多 只 完成 两 件 事 。 

CD 如 果 需 要 ， 分 配 一 个 动态 主 设备 号 。 

(2) 在 /proc/devices 中 创建 一 个 入 口 。 

在 将 来 的 内 核 中 ，register_blkdev0 可 能 会 被 去 掉 。 但 是 目前 的 大 部 分 驱动 仍然 调用 它 。 代 码 
清单 13.8 给 出 了 一 个 块 设备 驱动 注册 的 模板 。 
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代码 清单 13.8 ” 块 设备 驱动 注册 模板 


xxx major = register blkdev (xxx major, "xxx"); 
if (xxx major <= 0) ( /* Bo N */ 








return -EBUSY; 


} 





在 块 


T 
2 
3  printk(KERN WARNING "xxx: unable to get major number\n"); 
4 
5 


Ne] Linux 块 设备 驱动 的 模块 加 载 与 卸载 














设备 驱动 的 模块 加 载 函数 中 通常 需要 完成 如 下 工作 。 





























O 分 配 、 初 始 化 请 求 队列 ， 绑 定 请 求 队列 和 请 求 函 数 。 


© 分 配 、 初 始 化 gendisk， 给 gendisk 的 major. fops. queue 等 成 员 赋 1 
@ it 


代码 




















mH 


添加 gendisk . 


ol\ 


， 最 











J 


册 块 设备 驱动 。 
清单 13.9 和 13.10 分 别 给 出 了 使 


















































blk alloc queue0O 分 配 请 求 队列 并 使 用 blk queue - 
































make requestO 绑 定 “ 请 求 队列 ”和 “制造 请 求 ”的 函数 ， 以 及 使 用 blk init queueO 初 始 化 请 求 队 


列 并 绑 定 


{ 


WE 


4-0 NNnmPDo 
































] 
请 求 队列 与 请 求 处 理 函 数 两 种 不 同情 况 下 的 块 设备 驱动 模块 加 载 函数 模板 。 
代码 清单 13.9 块 设备 驱动 的 模块 加 载 函 数 模板 《使 用 blk. alloc. queue) 








State TAk INIL AXA auoübie (GUtOX (9L) 


/* ai gendisk */ 
xxx disks - alloc disk(1); 
if (!xxx disks) 

goto out; 


/* 抉 设备 驱动 注册 */ 
if (register blkdev(XXX MAJOR, "xxx")) { 
euer co c OE 





Goto Out 


} 


/* “请 求 队列 ”分 配 */ 
xxx queue = blk alloc queue (GFP KERNEL); 
if (!xxx queue) 
goto out queue; 
blk queue make request (xxx queue, &xxx make request); /* 绑 定 “制造 请 求 ”函数 */ 
blk queue hardsect size(xxx queue, xxx blocksize); /* 便 件 扇 区 尺寸 设置 */ 











/* gendisk 初始 化 */ 

XXX disks-»major = XXX MAJOR; 

xxx disks-»first minor - 0; 
xxx_disks->fops = &XXxX Op; 

XXX disks-»queue = xxx queue; 

SO AdS ks Ais Jews, Mexx s) 
add disk(xxx disks); /* 添加 gendisk */ 
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30 return 0; 
SL out queue: unregister blkdev(XXX MAJOR, "xxx"); 
32 (OXBhE E Oem Sk (SS) 


eoe 


33  blk cleanup queue (xxx queue); 




















34 
25 return -ENOMEM; 
3-3 
代码 清单 13.10 Hik E URGE EE DECURSU. EA blk. init. queue? 
db gEsuEMIG- sew. o abel, (el 
2 
E /* 抉 设 备 驱 动 注册 */ 
4 if (register blkdev(XXX MAJOR, "xxx")) { 
5) err = - EIO; 
6 goto out; 
7 } 
8 
9 ”/* 请 求 队列 初始 化 */ 
10 xxx queue = blk init queue (xxx request, xxx lock); 
1 if (!xxx queue) 
2 goto out queue; 
3 
4 blk queue hardsect size(xxx queue, xxx blocksize); /* 硬件 扇 区 尺寸 设置 */ 
E 
6  /* gendisk 初始 化 */ 
g xxx_disks->major = XXX_MAJOR; 
8 xxx disks-»first minor - 0; 
9 XXX disks-»5fops - &xxx op; 
20 XXX disks-»queue = xxx queue; 
ull Ee ede (0 Ol ee oe ede ,0:0 ul 
22 set capacity(xxx disks, xxx size *2); 
23 add disk(xxx disks); // 添 加 gendisk 
24 
25 return 0; 
26 out queue: unregister blkdev (XXX MAJOR, "xxx"); 
21 Suera PUTRAS KEATSKES), 
28 blk_cleanup_queue (xxx queue); 
29 
30 return - ENOMEM; 
2r y 











在 块 设备 驱动 的 模块 卸载 函数 中 完成 与 模块 加 载 函数 相反 的 工作 。 
Q 清除 请 求 队列 。 
(2) 删除 gendisk 和 对 gendisk 的 引用 。 
© 删除 对 块 设备 的 引用 ， 注 销 块 设备 驱动 。 

代码 清单 13.11 给 出 了 块 设 备 驱动 的 模块 卸载 函数 的 模板 。 


代码 清单 13.11 块 设备 驱动 的 模块 卸载 函数 模板 
SLALO VOLAL EKLE ty 


iL 

2. 4 

3 if (bdev) { 
4 

5 
































































































































invalidate bdev (xxx bdev, 1); 
blkdev put (xxx bdev); 
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6 ) 

7 del gendisk(xxx disks); /* 删除 gendisk */ 

8 pues kS KS) 

9 blk_cleanup_queue (xxx_queue [i]); /* 清除 请 求 队列 */ 
1l unregister blkdev(XXX MAJOR, "xxx"); 

Efi 


13.4 块 设备 的 打开 与 释放 


块 设备 驱动 的 open0 和 release0) 函 数 并 非 是 必须 的 ,一 个 简单 的 块 设备 驱动 可 以 不 提供 open) 
和 release K Zt. 

块 设备 驱动 的 open0 函 数 和 其 字符 设备 驱动 的 对 等 体 不 太 相 似 ， 不 以 相关 的 inode 和 file 结构 
体 指 针 作 为 参数 。 在 open0 中 我 们 可 以 通过 block. device 参数 bdev 获取 private_data、 在 release() 
函数 中 则 通过 gendisk 参数 disk 获取 ， 如 代码 清单 13.12 所 示 。 


























































































































代码 清单 13.12 ”在 块 设备 的 open()/release() 函 数 中 获取 private. data 


1 static int xxx open(struct block device *bdev, fmode t mode) 
2: d 

3 struct xxx dev *dev = bdev-»bd disk-»private data; 

4 

5 

6 

T xeturn 0; 

9g m 

9 

0 static int xxx release(struct gendisk *disk, fmode t mode) 
A di 

2 struct xxx dev *dev = disk-»private data; 

3 

4 . 

5 

6 return 0; 

UN 






































在 一 个 处 理 真 实 的 硬件 设备 的 驱动 中 ，open() 和 release(0) 方 法 还 应 当 设 置 驱 动 和 硬件 的 状态 ， 
这 些 工作 可 能 包括 启 停 磁 盘 、 加 锁 一 个 可 移出 设备 和 分 配 DMA 缓冲 等 。 




















Í 3.5 块 设 备 驱动 的 ioctl 函数 


与 字符 设备 驱动 一 样 ， 块 设备 可 以 包含 一 个 ioctl0 函 数 以 提供 对 设备 的 IO 控制 能 力 。 实 际 
上 ， 高 层 的 块 设备 层 代 码 处 理 了 绝 大 多 数 IO 控制 ， 如 BLKFLSBUF、BLKROSET、BLKDISCARD、 
HDIO_GETGEO、BLKROGET、BLKSECTGET 等 ， 因 此 ， 有 具体 的 块 设备 驱动 中 通常 只 需要 实现 
设备 相关 的 ioctl 命令 。 例 如 ， 源 代码 文件 为 drivers/block/floppy.c 中 实现 了 与 软驱 相关 的 命令 如 
FDEJECT、FDSETPRM、FDFMTTRK 等 。 
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13.0 块 设备 驱动 的 1/O 请 求 处 理 


13.6.1 使 用 请 求 队列 
块 设备 驱动 请 求 函数 的 原型 为 


void request(request queue t *queue); 



































这 个 函数 不 能 由 驱动 自己 调用 ， 只 有 当 内 核 认 为 是 时 候 让 驱动 处 理 对 设备 的 读 写 等 操作 时 ， 
































edi 





周 用 这 个 函数 。 






































J 
请 求 函数 可 以 在 没有 完成 请 求 队列 中 的 所 有 请 求 的 情况 下 返回 ， 甚 至 在 一 个 请 求 不 完成 都 可 


























































































































以 返回 。 但 是 ， 对 大 部 分 设备 而 言 ， 在 请 求 函数 中 处 理 完 所 有 请 求 后 再 返回 通常 是 值得 推荐 的 方 


























法 。 代 码 清单 13.14 给 出 了 一 个 简单 的 request0 函 数 的 例子 。 





代码 清单 13.13 ” 块 设备 驱动 请 求 函 数 例 程 

















1 static void xxx request(request queue t *q) 
20 
3 struct request *reqg; 
4 while ((req = elv next request(q)) != NULL) { 
5 struct xxx dev *dev = req-»rq disk-»private data; 
6 if (!blk fs request(req)) {/* 不 是 文件 系统 请 求 */ 
也 printk(KERN NOTICE "Skip non-fs request'in"); 
8 end request(req, 0); 
9 continue; 
0 } 
i Xxx transfer(dev, req-»sector, req-»current nr sectors, req-»buffer, 
2 rq data dir(req)); /* 处 理 这 个 请 求 */ 
3 end request(req, 1); /* 通知 成 功 完成 这 个 请 求 */ 
4 } 
9r 
6 
7 /* 完成 具体 的 块 设备 1/0 操作 */ 
8 static void xxx transfer(struct xxx dev *dev, unsigned long sector, unsigned 
9 long nsect, char *buffer, int write) 


20 ( 

2L unsigned long offset = sector * KERNEL SECTOR SIZE; 
2» unsigned long nbytes - nsect * KERNEL SECTOR SIZE; 
219) if ((offset + nbytes) > dev-»size) ( 


24 printk(KERN NOTICE "Beyond-end write ($1d $1d)Wn", offset, nbytes); 
25 return ; 

26. 7 

27 if (write) 

28 write dev(offset, buffer, nbytes); /* 向 设备 写 nbytes 个 字 节 的 数据 */ 
219 else 

30 read dev(offset, buffer, nbytes); /* 从 设备 读 nbytes 个 字 节 的 数据 */ 
SHE 






































上 述 代 码 第 4 行使 用 elv. next requestO 获 得 队列 中 第 一 个 未 完成 的 请 求 , end_requestO 会 将 请 














RA 
































ESRB pO. 8 6 行 判断 请 求 是 否 为 文件 系统 请 求 ， 如 果 不 是 ， 则 直接 清除 ， 调 用 endo 




















INUX 








oec 


289 





290 


Linux 设备 驱动 开发 详解 (第 2 版 ) 











request(), 4£3É25 end request0 的 第 二 个 参数 为 0 意味 着 处 理 该 请 求 失败 。 而 第 13 行 传递 给 
end requestO 的 第 二 个 参数 为 1 意味 着 该 请 求 处 理 成 功 。 

end_requestO 函 数 非常 重要 ， 其 源 代 码 如 代码 清单 13.14 所 示 。 不 过 要 留意 的 是 ， 新 的 内 核 版 
本 建议 在 驱动 中 调用 blk_end_request0 或 ”blk_end_request() 来 结束 request. 






















































































代码 清单 13.14 end. request() 函 数 源 代码 



























































1 void end request(struct request *req, int uptodate) 
2 
3 int error = 0; 
4 
5 if (uptodate <= 0) 
6 error = uptodate ? uptodate : -EIO; 
i 
8 . blk end request (req, error, req-»hard cur sectors << 9); 
9 ]j 
0 int  blk end request(struct request *rq, int error, unsigned int nr bytes) 
i d 
2 if (rq-»bio && Menda that request first(rq, error, nr bytes)) 
3 return 1; 
4 
5 add disk randomness (rq-»rq disk); 
6 
lu end that request last(rg, error); 
8 
9 return 0; 
OM 
当 设备 已 经 完成 一 个 VO 请 求 的 部 分 或 者 全 部 扇 区 传输 后 ， 它 必须 通告 块 设备 层 ， 上 述 代码 
中 的 第 12 和 17 行 完 成 这 个 工作 。_end_ that request_firstO) 函 数 的 原型 为 : 























int | end that request first(struct request *req, int error, 
int nr bytes) 


这 个 函数 告知 块 设备 层 , 块 设备 驱动 已 经 完成 nr_bytes 个 扇 区 的 传送 。_end_that request first 
0 的 返回 值 是 一 个 标志 ， 指 示 是 否 这 个 请 求 中 的 所 有 肩 区 已 经 被 传送 。 返 回 值 为 0 表示 所 有 的 局 
区 已 经 被 传送 并 且 这 个 请 求 完 成 ， 之 后 ， 我 们 必须 使 用 blkdev_dequeue_request() 来 从 队列 中 清除 
这 个 请 求 。 最 后 ， 将 这 个 请 求 传递 给 end that request lastO K Zi. 

void end that request last(struct request *req); 

end that request_lastO 通 知 所 有 正在 等 待 这 个 请 求 完 成 的 对 象 请 求 已 经 完成 并 回收 这 个 请 求 
结构 体 。 
第 15 行 的 add_disk_ randomnessO 函 数 的 作用 是 使 用 块 IO 请 求 的 时 间 信 息 来 给 系统 的 随机 数 
Tb vx RU, 它 不 影响 块 设备 驱动 。 但 是 , 仅 当 磁盘 的 操作 时 间 是 真正 随机 的 时 候 (Cgendisk 的 random 
成 员 不 为 0， 大 部 分 机 械 设备 如 此 )， 它 才 会 调用 add timer randomness()。 

代码 清单 13.15 给 出 了 一 个 更 复杂 的 请 求 函数 ， 它 进行 了 3 层 遍 历 : 遍历 请 求 队列 中 的 每 个 
请 求 ， 遍 历 请 求 中 的 每 个 bio， 遍 历 bio 中 的 每 个 段 。 


代码 清单 13.15 ”请求 函 数 遍 历 请 求 、bio 和 段 
1 static void xxx full request(request queue t *q) 
2 4 
3 struct request *req; 
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oec 























4 int sectors xferred; 

5 struct xxx_dev *dev = q->queuedata; 

6 ”/* 遍历 每 个 请 求 */ 

g while ((req = elv next request(q)) != NULL) { 

8 if (!blk fs request(req)) { 

9 printk(KERN NOTICE "Skip non-fs request'in"); 
0 
1 end request(req, 0); 
2 continue; 
3 } 
4 Sectors xferred = xxx xfer request(dev, req); 
5 end request(req, 1); /* 通知 成 功 完成 这 个 请 求 */ 
Gp 
7 /* WiGKABRE */ 
8 static int xxx xfer request(struct xxx dev *dev, struct request *req) 
9 





zo struct bio vec *bvec; 
21  /* 遍历 请 求 中 的 每 个 bio 的 每 个 segment */ 
2 rq for each segment(bvec, req, iter) { 



























































23 
DN 
25 } 
上 述 代 码 中 第 26 行 调用 的 rq_for_each_segment(0 实 际 是 一 个 二 重 循环 ， 它 的 第 一 重 循环 遍历 
一 个 request 的 每 个 bio， 第 二 重 循环 遍历 一 个 bio 的 每 个 segment: 
define rq for each segment(bvl, rg, iter) N 
OTe (se re) N 


bio for each segment(bvl, iter.bio, iter.i) 


图 13.3 所 示 为 一 个 请 求 队列 内 request, bio 以 及 bio 中 segment 的 层 层 遍历 关系 。 



























clv next request() 





.Iq for each bio() 


bio for each segment() 





请 求 队列 


13.3 通 历 一 个 请 求 队列 


13.6.2 不 使 用 请 求 队列 

使 用 请 求 队列 对 于 一 个 机 械 的 磁盘 设备 而 言 的 确 有 助 于 提高 系统 的 性 能 ， 但 是 对 于 许多 块 设 
备 ， 如 数码 相机 的 存储 卡 、RAM 盘 等 完全 可 真正 随机 访问 的 设备 而 言 ， 无 法 从 高 级 的 请 求 队列 
逻辑 中 获 益 。 对 于 这 些 设备 ， 块 层 支 持 “ 无 队列 ”的 操作 模式 ， 为 使 用 这 个 模式 ， 驱 动 必 须 提 供 
一 个 “制造 请 求 ” 函 数 ， 而 不 是 一 个 请 求 函数 ,“ 制 造 请 求 ” 函 数 的 原型 为 ; 


typedef int (make request fn) (request queue t *q, struct bio *bio); 
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上 述 函 数 的 第 











bio 结构 体 表示 一 个 或 多 个 要 传送 的 缓冲 区 。“ 制造 请 

















定 问 给 
在 


其 他 设备 。 


“制造 请 求 ” 

















应 该 使 








成 ” 
t a 


] bio endio() 




















再 次 调 




















已 经 




















数 中 处 理 bio 的 方式 与 13.6.1 小 节 : 






























































E 








一 个 非 零 值 ，bio 将 被 再 次 提交 。 


ARIDE À 


1 
2 4 
3 
4 
5 
6 
7 
8 


} 


为 了 使 用 无 队列 的 IO iS SR AERE, Y 
代码 清 自 


模板 。 





13.7.1 























É 13.16 所 示 为 一 个 “ 


代码 清单 13.16 


如 果 不 能 完成 这 个 请 求 ， 
应 的 UO 处 理 成 功 与 否 ， 





“制造 请 求 ” 








“H 








BR 
函数 通知 处 理 结束 ， 如 下 所 示 : 


void bio endio(struct bio 
参数 bytes 是 
同时 bio 结构 体 
] bio_endio(), 
不 管 对 























制造 请 求 ” 函 数 的 主要 参数 是 bio 结构 体 ， 这 个 








个 参数 仍然 是 “请 求 队列 ”但 是 这 个 “请 求 队列 ”实际 不 包含 任何 request; 
因为 块 层 没有 必要 将 bio 调整 为 request。 因 此 ， 














求 ”函数 或 者 



































接 进 行 传输 ， 或 者 把 请 求 重 















































讲解 的 完全 一 致 ，1 


RORIS UP, 








是 在 处 理 完成 后 

















*bio, unsigned int bytes, int error); 
传送 的 字 节 数 ， 它 可 以 比 这 个 bio 所 
FPF 的 当前 缓冲 区 指针 需要 更 新 。 当 设备 进 


这 意味 着 “部 分 完 























应 指出 一 个 错误 ， 


函数 都 应 该 返回 











判 造 请 求 ” 函 数 的 例子 。 


struct xxx dev *dev = q-»queuedata; 


int status; 
status - 


bio endio (bio, 


return 0; 





xxx xfer bio (dev, 


bio); 


bio-»bi size, status); 
































vmem disk 的 硬件 原理 


vmem disk 是 一 种 模拟 磁盘 ， 
来 的 内 存 空 间 来 模拟 出 一 个 磁盘 ， 





其 数据 实际 上 存储 在 RAM ! 





动 相应 章节 globalmem 驱动 的 块 方式 改造 。 


在 加 载 vmem disk.ko 后 ， 使 





























“制造 请 求 ”函数 例 程 


static int xxx make request(request queue t *q, struct bio *bio) 


/* ME bio */ 


/* 通告 结束 */ 














区 动 模块 的 加 载 函 数 应 遵循 代码 
É 13.10 的 模板 ， 而 使 用 请 求 队列 时 ， 引 


Í 3.7 实例 1: vmem disk 驱动 


0。 如 果 “ 制 造 请 求 ” 函 数 返回 


步 处 理 这 个 bio 后 ， 驱 动 应 该 








A HB ES error 参数 。 
































13.9 的 模板 而 非 




















K 动 模块 的 加 载 函 数 应 遵循 代码 清单 13.10 的 

















。 它 使 用 通过 vmalloc() 分 配 出 
以 块 设备 的 方式 来 访问 这 片 内 存 。 该 驱动 是 对 字符 设备 驱 




















默认 模块 参数 的 情况 下， 系统 会 增加 4 个 块 设备 结 点 : 





root@lihacker-laptop:~/develop/svn/1dd6410-read-only/training/kernel/drivers/vmem d 
tak ls =i /dev/vmem disk* 


lesewyoaew———— SE Cek 2191.5 
Ie db seexeWe «lied 251. 
jou ed ooe chis 251. 
loytwgouewy—o-- d. sexe che 251, 























0 2010-04-18 11:53 /dev/vmem diska 
16 2010-04-18 11:52 /dev/vmem diskb 
32 2010-04-18 11:52 /dev/vmem diskc 
48 2010-04-18 11:52 /dev/vmem diskd 





, mkfs.ext2 /dev/vmem diska 命令 的 执行 会 回馈 如 下 信息 : 
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root@lihacker-laptop:~/develop/svn/1dd6410-read-only/training/kernel/drivers/vmem d 


00O 


isk# mkfs.ext2 /dev/vmem_diska 
mke2fs. 1.41.4 (27-Jàn-2009) 
Filesystem label- 
OS type: Linux 
Block size-1024 (10g-0) 
Fragment size-1024 (10g-20) 
64 inodes, 512 blocks 
25 blocks (4.882) reserved for the super user 
First data block-1 
Maximum filesystem blocks-524288 
db Jebexe)m (essoxDHo 
8192 blocks per group, 8192 fragments per group 
64 inodes per group 


Writing inode tables: done 


Writing superblocks and filesystem accounting information: done 


This filesystem will be automatically checked every 36 mounts or 
180 days, whichever comes first. Use tune2fs -c or -i to override. 


它 将 /devvmem diska 格式 化 为 EXT2 文件 系统 。 之 后 我 们 可 以 mount 这 个 分 区 并 在 其 中 进行 
文件 读 写 。 
13.7.2 vmem disk 驱动 模块 的 加 载 与 卸载 

vmem disk 驱动 的 模块 加 载 函 数 完成 的 工作 与 13.3 节 给 出 的 模板 完全 一 致 ， 它 支持 “制造 请 
求 ”( 对 应 代码 清单 13.9)、 请 求 队列 (对 应 代码 清单 13.10) 两 种 模式 (留意 在 请 求 队列 方面 又 文 
持 简 、 繁 两 种 模式 )， 使 用 模块 参数 request mode 进行 区 分 。 代 码 清单 13.16 给 出 了 vmem disk 
设备 驱动 的 模块 加 载 与 卸载 函数 。 


代码 清单 13.17 vmem. disk 设备 驱动 的 模块 加 载 与 卸载 函数 
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1 Static int | init vmem disk ne 
2o d 
3 aep dip 
4 i 
5 * 注册 块 设备 
6 we 
vmem disk major = register blkdev(vmem disk major, "vmem disk"); 
8 if (vmem disk major <= 0) ( 
9 printk (KERN WARNING "vmem disk: unable to get major number in"); 
0 return -EBUSY; 
1 } 
Qe 
3 * 分 配 设备 数组 ， 初 始 化 它们 
4 x 
5 Devices - kmalloc(ndevices*sizeof (struct vmem disk dev), GFP KERNEL); 
6 if (Devices -- NULL) 
7 goto out unregister; 
8 for (i120; i « ndevices; i--*) 
9 setup device(Devices + i, i); 
20 
21 0péturn or 
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22 
23 out unregister: 
24 unregister blkdev(vmem disk major, "sbd"); 
25 return -ENOMEM; 
26. ] 
2, 
28 static void vmem disk exit (void) 
EE 
SUD DUIS 
os 
32. Or (uL Ua c wogselewaueesp ab» 4 
33 struct vmem disk dev *dev = Devices I i; 
34 
35 del timer sync(&dev-»timer); 
36 if (dev-»gd) ( 
37 del gendisk (dev->gd); 
38 put disk(dev-»9gqd); 
S9 J 
40 if (dev-»5queue) ( 
41 if (request mode -- RM NOQUEUE) 
42 kobject put (&dev-»queue-»kobj); 
43 else 
44 blk cleanup queue (dev-»queue); 
EISE) } 
46 if (dev-»data) 
47 vtfree(dev-»data); 
4 8 } 
49 unregister blkdev(vmem disk major, "vmem disk"); 
50 kfree(Devices); 
Gub 
52 
DOR 
54  * 设置 设备 
551 uf 
56 static void setup device(struct vmem disk dev *dev, int which) 
XE 
Bg Je 
59  * 分 配 globalmem 的 内 存 
60 */ 
61 memset (dev, 0, sizeof (struct vmem disk dev)); 
62 dev-»size = nsectors*hardsect size; 
63 dev-»data = vmalloc (dev-»size); 
64 if (dev-»data == NULL) { 
B5 printk (XHKERN NOTIDE "emalloc fatlgrte.Vvnt)s 
66 return; 
($3) 3 
68 spin lock init(&dev-»lock); 
69 
qug. ye 
71 * 使 用 一 个 timer 来 模拟 设备 invalidate 
E Sun 
73 init timer(&dev-»timer); 
74  dev-»timer.data = (unsigned long) dev; 
75  dev-»timer.function = vmem disk invalidate; 
76 
da INUX 
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e 
® 
"o e 
78  * I/O0 队列 ， 具 体 实现 依赖 于 我 们 是 否 使 用 make_request 函数 
O 
80 switch (request_mode) { 
81 case RM NOQUEUE: 
82 dev-»queue = blk alloc queue (GFP KERNEL); 
83 if (dev-»queue == NULL) 
84 goto out vfree; 
85 blk queue make request(dev-»queue, vmem disk make request); 
86 break; 
87 
88 case RM FULL: 
89 dev-»queue = blk init queue (vmem disk full request, &dev-»lock); 
90 if (dev-»queue == NULL) 
91 goto out vfree; 
92 break; 
eI 
94 default: 
95 printk(KERN NOTICE "Bad request mode $d, using simpleWn", request mode); 
96 
97 case RM SIMPLE: 
98 dev-»queue = blk init queue (vmem disk request, &dev-»lock); 
99 if (dev-»queue == NULL) 
00 goto out vfree; 
01 break; 
02 } 
03 blk queue hardsect size(dev-»queue, hardsect size); 
04 dev-»queue-»queuedata = dev; 
QU e 
06 * gendisk 分 配 与 初始 化 
ME 
08 dev-»gd = alloc disk(vmem disk MINORS); 
OSE ai C eer > 
Ü printk (BERN NOTIOE "allocodisk Eom 
1 goto out vfree; 
2 二 
3 dev-»5gd-»major = vmem disk major; 
4 dev-»gd-»first minor = which*vmem disk MINORS; 
5 dev->gd->fops = &vmem disk ops; 
6 dev-»gd-»5queue = dev-»queue; 
7 dev-»gd-»private data = dev; 
8 snprintf (dev-»gd-»disk name, 32, "vmem disk$c", which -* 'a'); 
9 set capacity(dev-»gd, nsectors*(hardsect size/KERNEL SECTOR SIZE)); 
20 add disk (dev->gd); 
KS CERIS 
22 
23 out vfree: 
24 if (dev->data) 
25 vfree(dev-»data); 
20-1 
上 述 代 码 中 引用 的 vmem disk major. ndevices. nsectors. hardsect size 都 是 模块 参数 ， 其 默 
认 值 定义 如 下 : 
Static int vmem disk major = 0; 
module param(vmem disk major, int, 0); 
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Static int hardsect size - 512; 


module param(hardsect size, int, 0); 
static int nsectors = 1024; /* 该 驱动 器 的 大 小 */ 
module param(nsectors, int, 0); 


Static int ndevices - 4; 


module param(ndevices, int, 0); 


/ 


* 











* 我 们 能 使 用 的 不 同 request 模式 

vi 

enum { 

RM SIMPLE = 0, /* 简单 请 求 函数 (对 应 代码 清单 13.13) */ 
1, 


RM FULL E 











/* 复杂 的 请 求 函数 (对 应 代码 清单 13.15) */ 




















RM NOQUEUE = 2, /* fiij make request (对 应 代码 清单 13.16) */ 


} 


r 





static int request_mode = RM_SIMPLE; 


module param(request mode, int, 0); 


在 模块 加 载 时 我 们 可 以 更 改 这 些 参数 。 尤 其 值得 注意 的 是 ，request mode 等 于 RM. SIMPLE, 


RM_FULL、RM_NOQUEUE 分 别 对 应 于 代码 清单 13.13、13.15 和 13.16 这 三 种 不 同 的 请 求 处 理 


方式 。 
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13.7.3 vmem disk 设备 驱动 block device operations 及 成 员 画 数 























vmem disk 提供 block device operations 结构 体 中 open()、release()、getgeo()、media_changed()、 
revalidate_disk() 这 些 成 员 函 数 ， 代 码 清单 13.18 给 出 了 vmem disk 设备 驱动 的 block_device_ 
operations 结构 体 定义 及 其 成 员 函 数 的 实现 。 


MS HOD ws ON D al eo epo 





NO No hN5 PO 


N N 
































代码 清单 13.18 vmem. disk 设备 驱动 block. device. operations 结构 体 及 成 员 函 数 


7 
* Open I close. 
A 
static int vmem disk open(struct block device *bdev, fmode t mode) 
( 
struct vmem disk dev *dev = bdev-»bd disk-»private data; 
del timer sync(&dev-»timer); 
0 spin lock(&dev-»lock); 
1 dev-»userstt; 
2 spin unlock(&dev-»lock); 
3 
4 return 0; 
pon 
6 
7 static int vmem disk release(struct gendisk *disk, fmode t mode) 
Sh uf 
9 struct vmem disk dev *dev = disk-»private data; 
0 
1 spin lock(&dev-»lock); 
2 dev-»users--; 
3 
4 if (!dev->users) { 
5 dev->timer.expires = jiffies + INVALIDATE_DELAY; 








INUX 


Linux 块 设 备 驱 动 











e 
® 

26 add timer(&dev-»timer); ® 

27 

28 spin unlock(&dev-»lock); 

29 

30 return 0; 

Sd 

22 

33 int vmem disk media changed(struct gendisk *gd) 

Sur 

35 struct vmem disk dev *dev - gd-»private data; 

36 

37 return dev-»media change; 

39 p 

39 

40 int vmem disk revalidate(struct gendisk *gd) 

zu { 

42 struct vmem disk dev *dev = gd->private_data; 

43 

44 if (dev-»media change) { 

45 dev-»media change - 0; 

46 memset (dev-»data, 0, dev-»size); 

"e } 

48 return 0; 

49 } 

50 

Sl Jf 

52 * invalidate() 在 定时 器 到 期 时 执行 ， 设 置 一 个 标志 来 模拟 磁盘 的 移 除 

Sa 

54 void vmem disk invalidate (unsigned long ldev) 

Sie d 

56 struct vmem disk dev *dev 9 (struct vmem disk dev *) Igdev; 

57 

58 spin lock(&dev-»lock); 

59 if (dev-»users || !dev-»data) 

60 printk (KERN WARNING "vmem disk: timer sanity check failedWin"); 

61 else 

62 dev-»media change = 1; 

63 spin unlock(&dev-»lock); 

64 } 

65 

Q6. 

67 * getgeo() 实现 

OA 

69 

70 static int vmem disk getgeo(struct block device *bdev, struct hd geometry *geo) 

EXE 

72 long size; 

73 struct vmem disk dev *dev = bdev-»bd disk-»private data; 

74 

75 size = dev-»size*(hardsect size/KERNEL SECTOR SIZE); 

76 geo-»cylinders = (size & -0x3f) >> 6; 

77 geo-»heads = 4; 

78 geo-»sectors = 16; 

79 geo-»start = 4; 

80 
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81 
82 
83 
84 
85 
86 
87 
88 
89 
90 
HL 
92 
93 
94 


return 0; 


] 

1s 

* block_device_operations 结构 体 

B 

Static struct block device operations vmem disk ops = { 
.owner = THIS MODULE, 

.open = vmem disk open, 

.release = vmem disk release, 

.media changed = vmem disk media changed, 
.revalidate disk = vmem disk revalidate, 
.getgeo = vmem disk getgeo, 

un 


13.7.4 vmem disk I/O 请 求 处 理 
在 vmem disk 驱动 中 , 通过 模块 参数 request. mode 的 方式 来 支持 3 种 不 同 的 请 求 处 理 模 式 以 


























t 
























































加 深 读者 对 它们 的 理解 ， 代 码 清 单 13.19 列 出 了 vmem disk 驱动 的 请 求 处 理 代码 。 


O E E hh > 


DO S kh Ec 





NO NO NS PF 
T oed E D 


N N N 
OU A 


B3 S obo. 
15 Qc 


W CO CO CO 
OUS peto 





























代码 清单 13.19 vmem. disk 设备 驱动 的 请 求 处 理 函 数 
让 
static void vmem disk transfer(struct vmem disk dev *dev, unsigned long sector, 
unsigned long nsect, char *buffer, int write) 
{ 
unsigned long offset = sector*KERNEL_SECTOR_SIZE; 
unsigned long nbytes = nsect*KERNEL_SECTOR_SIZE; 


if ((offset + nbytes) > dev->size) { 

printk (KERN NOTICE "Beyond-end write ($1d $1d)Wn", offset, nbytes); 
return; 

} 

if (write) 

memcpy (dev->data + offset, buffer, nbytes); 

else 

memcpy (buffer, dev->data + offset, nbytes); 

} 


DS 

* request 函数 的 简单 形式 
m 
Static void vmem disk request(struct request queue *q) 
( 

struct request *req; 





while ((req = elv next request(q)) !- NULL) { 

struct vmem disk dev *dev = req-»rq disk-»private data; 
if (! blk fs request(req)) { 

printk (KERN NOTICE "Skip non-fs request'in"); 

end request(req, 0); 

continue; 


} 
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e 
® 

34 ® 

35 vmem disk transfer(dev, req->sector, req->current_nr_sectors, 

36 req-»buffer, rq data dir (req)); 

23 

38 end request (req, 1); 

OMM 

4 0 } 

41 

42 

EG PE 

44  * 传输 一 个 单独 的 BIO 

aa a 

46 etacie int. vmem disk xfer bio(struct vmem disk dev *dev, struct bio *bDio) 

ZW og 

AS nme Le 

J9 etrüct bio vec *bvec; 

50 sector t sector - bio-»bi sector; 

Sal 

52 /* Do each segment independently. */ 

53 bio_for_each_segment (bvec, bio, i) { 

54 char *buffer - bio kmap atomic(bio, i, KM USERO); 

55 vmem disk transfer(dev, sector, bio cur sectors (bio), 

56 buffer, bio data dir(bio) == WRITE); 

SD SG OI t= pio tCur sectors (DIONI 

58 | bio kunmap atomic(bio, KM USERO); 

S9 

60 return 0; /* Always "succeed" */ 

61 ] 

62 

$3 f 

64  * 传输 一 个 完整 的 request 

o ERI 

66 static int vmem disk xfer request(struct vmem disk dev *dev, struct request *req) 

Eb 4 

68 

69 struct req iterator iter; 

70 int nsect - 0; 

VA ee bio wec C weg 

32 

73 rq for each segment(bvec, req, iter) { 

74 char *buffer - bio kmap atomic(iter.bio, iter.i, KM USERO); 

75 sector t sector - iter.bio-»bi sector; 

76 vmem disk transfer(dev, sector, bio cur sectors(iter.bio), 

7] buffer, bio data dir(iter.bio) == WRITE); 

78 sector t= bio cur sectors(iter.bio); 

79 | bio kunmap atomic(iter.bio, KM USERO); 

80 nsect += iter.bio-»bi size/KERNEL SECTOR SIZE; 

81 )] 

82 return nsect; 

Gor pq 

84 

85 

ge. e 

87  * 更 强大 的 request 处 理 

eg ww 
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89 static void vmem disk full request(struct request queue *q) 
SOME 

91 struct request *reg; 

92 ant sectors xferred; 

93 struct vmem disk dev *dev = q->queuedata; 


94 
95 while ((req = elv next request(q)) !- NULL) { 
96 if (! blk fs request(req)) ( 


97 printk (KERN NOTICE "Skip non-fs request'n"); 

98 end request(req, 0); 

99 continue; 

00 j 

01 sectors xferred = vmem disk xfer request(dev, req); 
02 end request (req, 1); 

OSI 

04 } 


og As 
07 * "制造 请 求 "方式 
Qe 
09 static int vmem disk make request(struct request queue *q, struct bio *bio) 
NET 
struct vmem disk dev *dev = q-»queuedata; 
dnb t MES. 


iL 
2 
E 
4 status - vmem disk xfer bio(dev, bio); 
5 bio endio(bio, status); 

6 


return 0; 
J 3 
上 述 代码 中 的 1 一 40 fT. 43—104 ff. 106—117 行 分 别 对 应 了 RM. SIMPLE, RM FULL. 
RM NOQUEUE 这 3 种 不 同 的 请 求 处 理 方式 。 
vmem_disk 的 驱动 位 于 VirtualBox 虚拟 机 映像 的 /home/lihacker/develop/svn/ldd6410-read-only/ 
training/kernel/drivers/ vmem disk 下 面 ， 已 经 有 编写 好 的 Makefile, HAEE 
可 得 到 vmem disk.ko 模块 。 



















































































运行 make 命令 即 
































1 3.8 实例 2 : IDE 硬盘 设备 驱动 


IDE (Integrated Drive Electronics) 接口 ， 也 就 是 集成 驱动 器 电路 接口 ， 原 名 为 ATA CAT 
Attachment, AT RAR) 接口 ， 其 本 意 为 将 硬盘 控制 器 与 盘 体 集成 在 一 起 的 硬盘 驱动 器 ， 经 
历 了 ATA-1 到 ATA-7 以 及 SATA-1 和 SATA-2 的 发 展 历 史 。ATA-1 至 ATA-4 采用 40 bH 
Hi, ATA-5 至 ATA-7 则 采用 40 针 80 芯 线 线 ， 虽 然 线 缆 数 量 增加 了 ， 但 是 逻辑 原理 没有 变 ， 
只 是 通过 物理 上 的 改变 来 达到 改善 PCB 信号 完整 性 的 目的 ， 它 提供 更 多 的 地 线 并 使 信号 线 临 
近 地 线 ， 从 而 减少 电流 回流 的 面积 。SATA-1 和 SATA-2 与 ATA-1 至 ATA-7 相 比 ， 数 据 传输 
方式 由 并 行 转变 为 串 行 。 

IDE 接口 的 硬件 原理 实际 上 非常 简单 ， 对 CPU 的 外 围 总 线 进 行 简单 扩展 后 就 可 外 接 IDE 控 
Bde, x 13.1 所 示 为 40 针 IDE 接口 的 引 脚 定义 。 
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表 13.1 IDE 接口 的 引 脚 定 义 
引 脚 BE S 信号 描述 信号 方向 引 脚 信 号 信号 描述 信号 方向 

1 RSET 复位 I 21 DMARQ DMA 请 求 o 
2 GND 地 IO 22 GND 地 

3 DD7 数据 位 7 IO 23 IDOW 写 选 通 I 
4 DD8 数据 位 8 IO 24 GND 地 

5 DD6 数据 位 6 IO 25 DIOR 读 选 通 I 
6 DD9 数据 位 9 IO 26 GND 地 

7 DD5 数据 位 5 LO 27 IORDY 通道 就 绪 O 
8 DD10 数据 位 10 IO 28 DUANE 司 步 电缆 选择 

9 DD4 数据 位 4 IO 29 DMACK DMA 应 答 O 
10 DD11 数据 位 11 IO 30 GND 也 

11 DD3 数据 位 3 IO 31 INTRQ 中 断 请 求 O 
12 DD12 数据 位 12 1/0 32 IOCSI6 6 hr IO Fri O 
13 DD2 数据 位 2 1/0 33 DAI 也 址 1 I 
14 DD13 数据 位 13 IO 34 PDIAG 诊断 完成 O 
15 DD 数据 位 1 IO 35 DAO 也 址 0 I 
16 DD14 数据 位 14 IO 36 DA2 也 址 2 I 
17 DDO 数据 位 0 IO 37 CS0 片 选 0 I 
18 DD15 数据 位 15 IO 38 CS1 片 选 1 I 
19 GND 地 39 DASP 驱动 器 状态 指示 O 
20 N.C 未 40 GND 地 


















































IDE 控制 器 提供 了 一 组 寄存 器 ， 通 过 这 些 寄存 器 ， 主 机 能 控制 IDE 驱动 器 的 行为 和 查询 其 状 
态 ， 表 13.2 所 示 IDE 接口 寄存 器 的 定义 。 





































































































表 13.2 IDE 接口 寄存 器 定义 
片 选 1 片 选 0 地 址 2 地 址 1 地 址 0 读 写 位 数 
1 0 0 0 0 数据 寄存 器 数据 寄存 器 16 
1 0 0 0 错误 寄存 器 特征 寄存 器 8 
1 0 0 1 0 扇 区 数 寄存 器 扇 区 数 寄存 器 8 
1 0 0 1 扇 区 号 寄存 器 扇 区 号 寄存 器 8 
1 0 0 0 柱 面 号 寄存 器 〈 低 8 位 ) | 柱 面 号 寄存 器 ( 低 8 位) | 8 
1 0 0 柱 面 号 寄存 器 (高 8 位 ) | 柱 面 号 寄存 器 (高 8 位 ) | 8 
1 0 1 0 驱动 器 选择 /磁头 寄存 器 驱动 器 选择 /磁头 寄存 器 | 8 
1 0 1 状态 寄存 器 命令 寄存 器 8 
0 1 1 0 状态 寄存 器 设备 控制 器 寄存 器 8 

IDE 硬盘 的 传输 模式 有 以 下 3 种 。 
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€ PIO (Programmed I/O) 模式 : PIO 模式 是 一 种 通过 CPU 执行 VO 端口 指令 来 进行 数 志 
读 写 的 数据 交换 模式 ， 是 最 早 的 硬盘 数据 传输 模式 ， 数 据 传输 速率 低下 ，CPU 占有 率 
也 很 高 。 

€ DMA (Driect Memory Access) 模式 : DMA 模式 是 一 种 不 经 过 CPU 而 直接 从 内 存 存 取 
数据 的 数据 交换 模式 。PIO 模式 下 硬盘 和 内 存 之 间 的 数据 传输 是 由 CPU 来 控制 的 ;而 在 
DMA 模式 下 ，CPU 只 需 向 DMA 控制 器 下 达 指 令 ， 让 DMA 控制 器 来 处 理 数 的 传送 ， 数 

据 传送 完毕 再 把 信息 反馈 给 CPU， 这 样 就 在 很 大 程度 上 减轻 了 CPU 资源 占有 率 。 

€ Ultra DMA (ÍFK UDMA) 模式 : 它 在 包含 了 DMA 模式 的 优点 的 基础 上 又 增加 了 CRC 
校 验 技术 ， 提 高 数据 传输 过 程 中 的 准确 性 ， 安 全 性 得 到 保障 。 另 外 ， 在 以 往 的 硬盘 数据 
传输 模式 下 ,一 个 时 钟 周期 只 传输 一 次 数据 ,而 在 UDMA 模式 中 逐渐 应 用 了 Double Data 
Rate〈 双 倍数 据 传输 ) 技术 ， 它 在 时 钟 的 上 升 沿 和 下 降 沿 各 自 进行 一 次 数据 传输 ， 使 数 

据 传 输 速 度 成 倍增 长 。 
除了 可 以 以 CHS (Cylinder. Head 和 Sector) 的 方式 定位 硬盘 的 扇 区 外 ， 还 可 以 用 LBA OE 

辑 块 线性 地 址 ) 的 方式 来 定位 ，CHS 可 以 换算 为 LBA。CHS 设计 最 多 只 允许 65536 个 柱 面 、16 

个 磁头 以 及 255 个 肩 区 / 磁 轨 。 这 就 将 容量 限制 为 267386880 个 扇 区 ， 即 大 约 137GB. 

假设 用 c 表示 当前 柱 面 号 ，h 表示 当前 磁头 写 ，cs 表示 起 始 柱 面 号 ，hs 表示 起 始 磁 头号 ，ss 

示 起 始 肩 区 号 ，ps 表示 每 磁道 有 多 少 个 扇 区 ，ph 表示 每 柱 面 有 多 少 个 磁道 (一 般 情况 下 ，cs = 

0、hs=0、ss=1、ps=63、ph=255)，LBA 与 CHS 有 如 下 对 应 关系 : 

lba= (c-cs) *ph*ps+ (h-hs) *ps+ (s-ss) 

LBA 使 得 系统 忽略 硬盘 的 几何 结构 ， 交 由 驱动 器 来 完成 。 系 统 不 需要 去 查询 CHS 值 ， 而 只 

需要 查询 逻辑 块 地 址 (Logical Block Address，LBA)， 驱 动 器 电子 装置 会 找 出 要 读 或 写 的 实际 扇 

IX. ifj LBA48 (48 位 逻辑 块 地 址 ) 则 可 以 使 系统 支持 超过 137GB 的 硬盘 。 
Linux 内 核 中 ， 早 期 常 使 用 drivers/ide 目录 下 的 驱动 ， 而 如 今 在 代入 式 系统 中 则 多 使 用 

drivers/ata 下 的 驱动 ， 尤 其 值得 一 提 的 是 drivers/ata/ 的 pata platform.c 和 pata *.c 文件 联合 起 来 实 

现 了 一 个 平台 无 关 的 并 行 ATA 驱动 ， 这 种 情况 下 ， 连 接 了 藤 入 式 硬盘 的 电路 板 只 需要 在 板 文件 

中 添加 与 并 行 ATA 设备 相关 的 平台 设备 和 资源 信息 即 可 ， 不 需要 编写 一 行 驱 动 代 码 就 可 以 让 硬 

盘 工 作 。 代 码 清单 13.20 给 出 了 arch/arm/mach-rpc/riscpc.c 板 文件 中 新 增 pata. platform 设备 的 例子 。 
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代码 清单 13.20 ”使 用 pata. platform 驱动 连接 IDE 硬盘 





Static struct pata platform info pata platform data - 
EE OI OE S hiis = 2, 
}; 


[9 md 


S Star 


di 

2 

3 

4 

5 static struct resource pata resources[] = { 
6 

y 0x03010760, 
8 


.end = 0x030107df, 
9 sags = IORESOURCE MEM, 
10 ), 
11 [EX LÁ 
T2 start = 0x03010fd8, 
T end = 0x03010fdb, 


IORESOURCE_MEM, 
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dm ), 

16 (2) = 

E SEALE = IRQ HARDDISK, 

18 .end = IRQ HARDDISK, 

159) cat Ives] = IORESOURCE IRQ, 

20 ), 

Zi $5 

22 

23 static struct platform device pata device = ( 

24 .name = "pata platform", 

2:5 Srel E, 

26 .num resources = ARRAY SIZE(pata resources), 
2T . resource = pata_resources, 

28 . dev = { 

29 .platform data - &pata platform data, 

SO .Coherent dma mask 0 /* grumble */ 
ES ), 

37 Jg 
































上 述 代 码 中 的 两 个 IORESOURCE MEM 资源 对 应 于 IDE 硬盘 连接 的 两 个 内 存 区 域 。 
IORESOURCE IRQ 资源 是 硬盘 使 用 的 CPU 的 中 断 号 。 


INO s 


块 设备 的 IO 操作 方式 与 字符 设备 存在 较 大 的 不 同 ， 因 而 引入 了 request_queue、request、bio 
等 一 系列 数据 结构 。 在 整个 块 设备 的 VO 操作 中 ， 贯 穿 于 始终 的 就 是 “请 求 ” 字符 设备 的 IO PR 
作 则 是 直接 进行 不 绕 弯 ， 块 设备 的 IO 操作 会 排队 和 整合 。 

驱动 的 任务 是 处 理 请 求 ， 对 请 求 的 排队 和 整合 由 IO 调度 算法 解决 ， 因 此 ， 块 设备 驱动 的 核 
心 就 是 请 求 处 理 函 数 或 “制造 请 求 ” 函 数 。 
尽管 在 块 设备 驱动 中 仍然 存在 block device operations 结构 体 及 其 成 员 函 数 ,但 其 不 再 包含 
写 一 类 的 成 员 函 数 ， 而 只 是 包含 打开 、 释 放 及 IO 控制 等 与 具体 读 写 无 关 的 函数 。 

块 设备 驱动 的 结构 相当 复杂 的 ， 但 幸运 的 是 ， 块 设备 不 像 字 符 设备 那么 包罗 万 象 ， 它 通常 就 
是 存储 设备 ， 而 且 驱 动 的 主体 已 经 由 Linux 内 核 提 供 ， 针 对 一 个 特定 的 硬件 系统 ， 驱 动工 程 师 所 
涉及 的 工作 往往 只 是 编写 极其 少量 的 与 硬件 平台 相关 的 代码 。 
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本 章 导读 
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在 Linux 系统 中 ， 终 端 设备 非常 重要 ， 没 有 终端 设备 ， 系 统 将 无 法 向 
用 户 反 馈 信 息 ，Linux 中 包含 控制 台 、 串 口 和 伪 终 端 3 类 终端 设备 。 















































驱动 的 框架 结构 ， 重 点 描述 ty driver 结构 体 及 其 成 员 。 
14.3—14.5 节 在 14.2 节 的 基础 上 ， 分 别 讲解 了 Linux 终端 设备 驱动 模 

















置 的 编程 方法 。 
在 Linux 中 ， 串 口 驱 动 完 










































































14.7 节 则 具体 给 出 了 串口 tty 5 








14.8 节 基 于 14.6 和 14.7 节 的 讲解 给 出 了 时 





S3C6410 集成 UART 的 驱动 。 
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区 动 的 实现 方法 。 





全 遵循 ety 驱动 的 机 
层 操 作 的 再 次 封装 ，14.6 节 描 述 了 Linux 针对 串 











REI 


匡 架 结构 ， 但 是 进 























解 了 Linux 终端 设备 








RIER RAA open(0)、close0 函 数 ， 数 据 读 写 流程 及 tty 设备 线路 设 


Ar i 





O tty 驱动 的 这 一 3 





tty 驱动 的 设计 实 


时 装 , 


14.1 


公司 生产 的 。Linux ! 
1.， 串 行 端口 终端 (/dev/ttySn) 

(Serial Port Terminal) 是 使 用 计算 机 串 行 端口 连接 的 终端 设备 。 计 算 机 把 每 个 
个 字符 设备 。 这 些 串 行 端口 所 对 应 的 设备 名 称 是 /devwttyS0《〈 或 /dewtty0)、 


rj 














FH fT 3m 口 终端 
品行 端口 都 看 作 是 一 


Linux 终端 设备 驱动 


冬 端 设备 


fr Linux 系统 中 ,终端 是 一 种 字符 型 设备 , 它 有 多 种 类 型 ,通常 使 用 tty 来 简称 各 种 类 型 的 终 
端 设 备 ,tty 是 Teletype 的 缩写 , Teletype 是 最 早出 现 的 一 种 终端 设备 , 很 像 电 传 打字 机 , 是 由 Teletype 





































































































包含 如 下 几 类 终端 设备 。 


























/dewttyS1 〈 或 /dewtty1) 等 ， 设 备 号 分 别 是 〈4，0)、(4，1) 等 。 





























在 命令 行 上 把 标准 输出 重 定向 到 端口 对 应 的 设备 文件 名 上 就 可 以 通过 该 端口 发 送 数据 ， 例 














如 ， 在 命令 行 提 示 符 下 键入 : echo test > /dev/ttyS1 会 把 单词 “test” 发 送 到 连接 在 ttyS1 端口 的 





设备 上 。 
目前 USB- 串 












































口 转换 器 也 已 经 非常 常用 ,其 对 应 设备 结 点 通常 为 /dewttyUSB0、/dewttyUSB1 等 。 














2. 伪 终 端 〈/dewpty/) 
伪 终 端 pty (Pseudo Terminal) 是 成 对 的 逻辑 终端 设备 ， 并 存在 成 对 的 设备 文件 ， 如 /dev/ptyp3 


























备 ， 则 它 对 该 端口 





























和 /dev/ttyp3， 它 们 与 实际 物理 设备 并 不 直接 相关 。 如 果 一 个 程序 把 ttyp3 看 作 是 一 个 串 行 端口 设 
的 读 / 写 操作 会 反映 在 该 逻辑 终端 设备 对 应 的 ttyp3 E, 而 ttyp3 则 是 另 一 个 程序 
用 于 读 写 操作 的 逻辑 设备 。 这 样 ， 两 个 程序 就 可 以 通过 这 种 逻辑 设备 进行 互相 交流 ， 使 用 ttyp3 














































































































的 程序 会 认为 自己 正在 与 一 个 串 行 端口 进行 通信 。 

















以 telnet 为 例 ， 如 


果 某 人 在 使 用 telnet 程序 连接 到 Linux 系统 ， 则 telnet 程序 就 可 能 会 开始 连 
接 到 设备 ptyp2 上 ， 而 此 时 一 个 getty 程序 会 运行 在 对 应 的 ttyp2 端口 上 。 当 telnet 从 远 端 获取 了 
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一 个 字符 时 ， 该 字符 就 会 通过 ptyp2. ttyp2 传递 给 getty 程序 ， 而 getty 程序 则 会 通过 ttyp2、ptyp2 
和 telnet 程序 返回 “login:” 


通过 使 用 适当 的 软件 ， 



































合 的 方法 来 实现 pty。 目 









































UAI 


字符 串 信 息 。 这 样 ， 登 录 程序 与 telnet 程序 就 通过 伪 终 端 进行 通信 。 




































































可 以 把 两 个 或 多 个 伪 终 端 设备 连接 到 同一 个 物理 串 行 端口 上 。 
而 目前 的 Linux 版 本 常 采 用 pts Cpseudo-terminal slave) 与 ptmx (pseudo-terminal master) 配 
录 /dev/pts 是 一 个 类 型 为 devpts 的 文件 系统 ， 并 且 可 以 在 被 加 载 文件 系 









































统 列表 中 看 到 。/devptmx 是 1 个 主 设备 号 为 S， 次 设备 号 为 2 的 字符 设备 ， 它 被 用 于 创建 一 个 
master/slave 对 。 当 某 进 程 打开 /devptmx 的 时 候 ， 它 将 得 到 一 个 master 的 文件 描述 符 ， 每 个 被 打 
开 的 文件 描述 符 对 应 一 个 独立 的 master, 而 且 对 应 一 个 pts; 将 该 文件 描述 符 作为 参数 传 入 ptsname 
可 以 得 到 pts 的 路 径 。 




















的 设备 特殊 文件 。 





3. 控制 终端 
如 果 当 前 进程 有 控制 终端 (Controlling Terminal) 的 话 ， 那 么 /dewtty 就 是 当前 进程 的 控制 终端 



















































































(/dev/tty) 


























可 以 使 

















查看 它 具 体 对 应 明 


lihackereli 
RTO EEY 

















STAT 





























IRA “ps -ax” 来 查看 进程 与 哪个 控制 终端 相连 ， 使 用 命令 “tty” 可 以 






































个 实际 终端 设备 。/dev/tty 有 些 类 似 于 到 实际 所 使 用 终端 设备 的 一 个 link， 例 如 : 


hacker-1 





laptop:/$ ps ax 


TIME COMMAND 
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dL ^E Ss 0:06 /sbin/init 

ZIP SR 0:00 [kthreadd] 

da S« 0:00 [migration/0] 
TESTE: SS 0:02 /sbin/udevd --daemon 
ONE S< 0:00 [kpsmoused] 
2O12 eey Ss+ 0:00 /sbin/getty 38400 tty4 
DON MEE Ss+ 0:00 /sbin/getty 38400 tty5 
2019 tty2 Sst 0:00 /sbin/getty 38400 tty2 
223 Ey Ss+ 0:00 /sbin/getty 38400 tty3 
2022 tty6 Ss+ 0:00 /sbin/getty 38400 tty6 
29. Ss 0:00 /usr/sbin/acpid -c /etc/acpi/events -s 


/var/run/acpid.socket 


4075 pts/0O Ss 0:03 bash 














4580 pts/1 Ss 0:01 bash 

4596 pts/1 SE QrO0O ssh lThackerd10.-0.2.15 

4597 ? Ss 0:00 sshd: lihacker [priv] 

4606 ? S 0:00 sshd: lihacker(pts/2 

4608 pts/2 Ss OOL -bash 

4952 pts/0 R+ QOO ms ax 

内 核 线程 (如 kthreadd》 和 用 户 空间 的 守护 进程 (如 udevd) 是 没有 控制 终端 的 ， 因 此 其 tty 





























栏目 标注 的 是 “? ”。 

4. 控制 台 终端 (/dev/ttyn，/dev/console) 

在 UNIX 系统 中 ， 计 算 机 显示 器 通常 被 称 为 控制 台 终 端 〈console)。 它 仿真 了 类 型 为 Linux 
的 一 种 终端 (TERM=Linux )， 并 且 有 一 些 设备 特殊 文件 与 之 相关 联 ， tty0、ttyl、tty2 等 。 当 用 户 
在 控制 台 上 登录 时 ,使 用 的 是 ttyl1。 使 用 Altr[F1 一 F6] 组 合 键 时 ， 我 们 就 可 以 切换 到 tty2、tty3 等 
上 面 去 。ttyl~tty6 等 称 为 虚拟 终端 ,而 tty0 则 是 当前 所 使 用 虚拟 终端 的 一 个 别名 ,系统 所 产生 的 
信息 会 发 送 到 该 终端 上 。 因 此 不 管 当前 正在 使 用 哪个 虚拟 终端 ， 系 统 信息 都 会 发 送 到 控制 台 终 端 
上 。 用 户 可 以 登录 到 不 同 的 虚拟 终端 上 去 ， 因 而 可 以 让 系统 同时 有 几 个 不 同 的 会 话 期 存在 。 只 有 
系统 或 超级 用 户 root 可 以 向 /dev/tty0 进行 写 操作 。 

在 Linux 中 ， 可 以 在 系统 启动 命令 行 里 指定 当前 的 输出 终端 ， 格 式 如 下 : 


console-device, options 


device 指 代 的 是 终端 设备 ， 可 以 是 tty0《〈 前 台 的 虚拟 终端 )、ttyX E X 个 虚拟 终端 )、ttySX 
(第 义 个 串口 )、lp0 (第 一 个 并 口 ) 等 。 
options 指 代 对 device 进行 的 设置 , 它 取决 于 具体 的 设备 驱动 。 对 于 串口 设备 , 参数 用 来 定义 为 : 
波 特 率 、 校 验 位 、 位 数 ， 格 式 为 BBBBPN， 其 中 BBBB ERREK, P RIR o/e), N 
表示 位 数 ， 默 认 options 是 9600n8. 
用 户 可 以 在 内 核 命令 行 中 同时 设 定 多 个 console， 这 样 输出 将 会 在 所 有 的 console 上 显示 ， 而 
当 用 户 调用 open0 打 开 /devwconsole 时 ， 最 后 一 个 console 将 会 返回 作为 当前 值 。 例 如 : 
console=ttyS1, 9600 console=tty0 
定义 了 两 个 console， 而 调用 open() 打 开 /dev/console 时 ， 将 使 用 虚拟 终端 tty0。 但 是 内 核 
消息 会 在 tty0 VGA 虚拟 终端 和 串口 ttyS1 上 同时 显示 。 简 单 地 说 ， 我 们 可 以 把 /dev/console 看 
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E PR B EH tty 文件 接口 ， 设 备 号 位 0x0501， 当 对 其 调用 tty_open0 时 ， 它 会 转 义 为 实际 
的 终端 设备 。 

通过 查看 /proc/tty/drivers 文件 可 以 获知 什么 类 型 的 tty 设备 存在 以 及 什么 驱动 被 加 载 到 内 核 ， 
这 个 文件 包括 一 个 当前 存在 的 不 同 tty 驱动 的 列表 ， 包 括 驱 动 名 、 缺 省 的 节点 名 、 驱 动 的 主编 号 、 
这 个 驱动 使 用 的 次 编号 范围 ， 以 及 tty 驱动 的 类 型 。 例 如 ， 下 面 给 出 了 一 个 /proc/tty/drivers 文件 的 
列子 : 


[root8(localhost root]£ cat /proc/tty/drivers 






































































































































/dev/tty /dev/tty 5 0 system:/dev/tty 
/dev/console / dev/console 5 1 system:console 
/dev/ptmx / dev/ptmx 5 2 system 
/dev/vc/0 / dev/vc/0 4 0 system:vtmaster 
serial /dev/ttys 4 64-67 serial 

pty slave /dev/pts 136 0-1048575 pty:slave 

pty master / dev/ptm 128 0-1048575 pty:master 
pty slave /dev/ttyp 3 0-255 pty:slave 

pty master /dev/pty 2 0-255 pty:master 

unknown /dev/tty 4 1-63 console 


Í 


规程 的 工作 是 以 特殊 的 方式 格式 化 从 一 个 用 户 或 者 


4.2 终端 设备 驱动 结构 


Linux 内 核 中 tty 的 层次 结构 如 图 14.1 所 示 ， 包 含 tty 核心 、tty 线路 规程 和 tty 驱动 ，tty 线路 
























































硬件 收 到 的 数据 ， 这 种 格式 化 常常 采用 一 个 协议 转 
换 的 形式 ， 例 如 PPP 和 Bluetooth. tty 设备 发 送 数 
据 的 流程 为 : tty 核心 从 一 个 用 户 获取 将 要 发 送 给 一 
个 tty 设备 的 数据 ,tty 核心 将 数据 传递 给 tty 线路 规 他 线路 规程 
时 驱动 ， 接 着 数据 被 传递 到 tty 驱动 ，tty 驱动 将 数 
据 转 换 为 可 以 发 送 给 硬件 的 格式 。 接 收 数据 的 流程 tty 驱 动 
为 : 从 tty 硬件 接收 到 的 数据 向 上 交 给 tty 驱动 ， 进 
入 tty 线路 规程 驱动 ， 再 进入 ty 核心 ， 在 这 里 它 被 14.1 tty 分 层 结构 
一 个 用 户 获取 。 尽 管 大 多 数 时 候 tty 核心 和 tty 之 间 的 数据 传输 会 经 历 tty 线路 规程 的 转换 ， 
tty 驱动 与 tty 核心 之 间 也 可 以 直接 传输 数据 。 
图 14.2 显示 了 与 tty 相关 的 主要 源 文件 及 数据 的 流向 。drivers/chartty io.c 定义 了 tty 设备 通 
用 的 file operations 结构 体 并 实现 了 接口 函数 tty_register_driver() 用 于 注册 tty 设备 ， 它 会 利用 
fs/char_dev.c 提供 的 接口 函数 注册 字符 设备 ， 与 具体 设备 对 应 的 tty 驱动 将 实现 tty. driver 结构 体 
的 成 员 函 数 。 同 时 tty io.c 也 提供 了 tty_register_ldisc0 接 口 函 数 用 于 注册 线路 规程 ， 典 型 地 ， 例 
如 drivers/char/n tty.c 文件 则 针对 N_TTY 线路 规程 实现 了 tty_disc 结构 体 中 的 成 员 。 
从 图 14.2 可 以 看 出 ,特定 tty 设备 驱动 的 主体 工作 是 填充 tty. driver 结构 体 中 的 成 员 ， 实 现 3 
的 成 员 函 数 ，tty_driver 结构 体 的 定义 如 代码 清单 14.1. 





tty 核 心 
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il 
2 
3 
4 
5 
6 
7 
8 
9 


Oo c oy Cho as cO BO EC 





NO No Y Y 
UO UBO CQ NO 


NO NN 
o On e 


NNN 
«o 0 N 


Co CO CO 
po EX COS 


33 
34 }; 


tty driver 结构 体 中 的 magic 表示 给 这 个 结构 体 的 “ 约 数 ” 设 为 TTY DRIVER MAGIC (HJ 
0x5402)， 在 alloc tty driver() EK Zt 
name ^ driver name 的 不 同 在 于 后 者 表示 驱动 的 名 字 ， 用 在 /proc/tty 和 sysfs 中 ， 而 前 者 表 





| fs/char dev.c | 


EE 


struct file operations 








ity jo.c 


tty register driver() 
struct tty driver 


XXX tty.c 





| n tty.c 


tty register ldisc() 
struct tty disc 








ooooo 
Dooo 


14.2 tty 主要 源 文件 关系 及 数据 流向 


代码 清单 14.1 


Struct rey driver T] 


IE magic; 

struct kref kref; 
struct cdev cdev; 
struct module  *owner; 


const char *driver name; 
const char *name; 

SÉRE name_base; 

int major; 

int minor start; 

int minor num; 

abite, num; 


short type; 

short subtype; 

Struct ktermios init tCermios; 

aiat, flags; 
SI 
struct tty driver *other; 


jt 

* tty 数据 结构 指针 

S 

IE 

struct ktermios **termios; 

struct ktermios **termios locked; 
void *driver state; 


/* 
* 驱动 中 的 操作 函数 
yi 





const struct tty operations *ops; 
Struct list head tty drivers; 

















被 初始 化 。 











ffs 
Us 


y: 
/* 
i 
i 
yit 
po 
ffs 
Viia 
yit 
Pic 


tty driver 结构 体 


该 结构 体 的 约 数 */ 


Reference 管理 */ 


设备 号 */ 
F 始 次 设备 号 */ 
[能 的 设备 数量 */ 





uL 


MH 





z| 


被 分 配 设备 的 数量 */ 


tty 驱动 的 类 型 */ 
tty 驱动 的 子 类 */ 


初始 的 termios */ 


tty 驱动 标志 */ 
/proc AL */ 
仅 对 PTY 驱动 有 用 

















ur 
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示 驱 动 的 设备 节点 名 。 

type 与 subtype 描述 tty 驱动 的 类 型 和 子 类 型 ，subtype 的 值 依赖 于 type; type 成 员 的 可 能 值 为 
TTY DRIVER TYPE SYSTEM (subtype 应 当 设 为 SYSTEM TYPE TTY. SYSTEM TYEP_ 
CONSOLE. SYSTEM TYPE SYSCONS Ei SYSTEM TYPE SYSPTMXO. TTY DRIVER TYPE 
CONSOLE 〈 仅 被 控制 台 驱 动 使 用 )、TTY_DRIVER_TYPE_SERIAL (被 任何 串 行 类 型 驱动 使 用 ， 
subtype 通常 设 为 SERIAL TYPE NORMAL). TTY DRIVER TYPE PTY (被 伪 控 制 台 接口 pty 
使 用 , 此 时 subtype 需要 被 设置 为 PTY_TYPE MASTER 或 PTY_TYPE_ SLAVE)、TTY DRIVER - 
TYPE SCC (Hi SCC 驱动 使 用 )。 

init termios 为 初始 线路 设置 ， 为 一 个 termios 结构 体 ， 这 个 成 员 被 用 来 提供 一 个 线路 设置 集合 。 

termios 用 于 保存 当前 的 线路 设置 ， 这 些 线路 设置 控制 当前 波 特 率 、 数 据 大 小 、 数 据 流 控 设 置 
等 ， 这 个 结构 体 包含 tcflag t c_iflag《〈 输 入 模式 标志 )、tcflag_ t c oflag 〈 输 出 模式 标志 )、tcflag t 
c_cflag〈 控 制 模式 标志 )、tcflag t c_lflag (本 地 模式 标志 )、cc_t c line (线路 规程 类 型 )、cce + 
c_cc[NCCS] (一 个 控制 字符 数组 ) 等 成 员 。 

驱动 会 使 用 一 个 标准 的 数值 集 初始 化 这 个 成 员 , "ELS UL EI tty_std_termios 变量 , tty_std_termos 
在 tty 核心 中 的 定义 如 代码 清单 142. 





































































































































































































































































































































































































代码 清单 14.2 tty. std. termios 变量 


1 struct ktermios tty std termios - ( 

2 .c iflag = ICRNL | IXON, /* AW NEUSX */ 

3 .c oflag = OPOST | ONLCR,/* 输出 模式 */ 

4 .c cflag = B38400 | CS8 | CREAD | HUPCL,/* 控制 模式 */ 
5 .c lflag = ISIG | ICANON | ECHO | ECHOE | ECHOK | 
6 
7 
8 





ECHOCTL | ECHOKE | IEXTEN, /* 本 地 模式 */ 
.c cc = INIT C CC, /* 控制 字符 ， 用 来 修改 终端 的 特殊 字符 映射 */ 
.C ispeed = 38400, 
9 .C ospeed = 38400 
10. 5$ 


tty driver 结构 体 中 的 major. minor start, minor num 表示 主 设备 号 、 次 设备 号 及 可 能 的 次 设 
备 数 ，name 表示 设备 名 (如 ttyS)， 第 32 行 是 一 个 tty_operations 结构 体 的 指针 ， 它 的 定义 如 代码 
清单 14.3， 其 成 员 函 数 通常 需 在 特定 设备 tty 驱动 模块 初始 化 函数 中 被 赋值 。 


代码 清单 14.3 tty. operations 结构 体 































































































SEE OD E Beds o SN 

2 struct tty struct * (*lookup) (struct tty driver *driver, 

3 struct inode *inode, iut idxy. 

4 Hae asce ih (Ne eo eey oa ou oe ee ee "ete E 
5 void (*remove) (struct tty driver *driver, struct tty struct *tty); 
6 sene. Eoen (su iur hescib(e So crablles ^ 3630193) 5 

7 voie Ted) (Scrios ee te St 

8 yore emiten (Gisele ie ee Aeey E 


9 Tae (eee) (Me ol iie Ne eno In e ey 

10 const unsigned char *buf, int count); 
11 Te Men en (eve (een Mele een Uline nel el fom) 
12 Sakel roen eene) (tt E VAR BU CC CSY2 RT 

13) (mls to Se ct 

14 to Sm uf) te tt te Cte 

15 aee (eon (Ee Tey Stoor "Uri ee se ke v" deadly 
16 unsigned int cmd, unsigned long arg); 
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17 onci om et et Ey et tS nett 
18 unsigned int cmd, unsigned long arg); 
19 Oc oc cotemmlios (st ruet et VIRI eet th St Ge Ino SMS) 


( 
20 voel imaan E (Se i a ten v i) E 

21 Ne (rel (Se te 

22 votel Ceran) (tr el ey ne IE ESD 

pu ADL Mee (el | etes Struct e Ey) 

24 void (*hangup) (struct tty struct *tty); 

25 ine C breakiceiiiseruct tt e E Cey a abge Ea 


26 Vorel (Suelo un tu tse i p 

2 vOe ser doller) ((tescuxole Tei Seron PTS) 

28 wal Mrene voce sene (ee ae ee Seabee ee oae noe 

29 TO 

30 人 

ST ist count, int "ent. votd data) 

92 ne (tl me (Se te tt te tS 

33 Sbane. "(l'etealcexendexeie)) (st ue Ct vt uo eey S eruet en e 

34 unsigned int set, unsigned int clear); 

35 SEE 
36 struct winsize *ws); 

37 int (*set termiox) (struct tty struct *tty, struct termiox *tnew); 

38 #ifdef CONFIG CONSOLE POLL 

39 下 
40 int (*poll get char) (struct tty driver *driver, int line); 

41 void (*poll put char) (struct tty driver *driver, int line, char ch); 
42 tendif 

43); 





N 











put_char0 为 单字 节 写 函数 ， 当 单个 字 节 被 写 入 设备 时 这 个 函数 被 tty 核心 调用 ， 如 果 一 个 tty 
驱动 没有 定义 这 个 函数 ， 将 使 用 count 参数 为 1 的 write0 函 数 。 

flush chars() 5 wait_until_sent(O 函 数 都 用 于 刷新 数据 到 硬件 。 

write_room() 指 示 有 多 少 缓冲 区 空 闻 ，chars_in_buffer() 指 示 绥 冲 区 中 包含 的 数据 数 。 
当 在 tty 设备 的 设备 节点 上 执行 IOCTL 操作 时 ,tty_operations 结构 体 的 ioctl0) 函 数 会 被 tty 核 
心 调用 。 
当 设 备 的 termios 设置 被 改变 时 ，set_termios() 函 数 将 被 tty 核心 调用 。 

throttle(). unthrottle(). stop) fI startO) 为 数据 抑制 函数 ， 这 些 函 数 用 来 辅助 控制 tty 核心 的 输 
入 缓冲 区 。 当 tty 核心 的 输入 缓冲 区 满 时 ，throttle0 函 数 将 被 调用 ，tty 驱动 试图 通知 设备 不 应 当 发 
送 字符 给 它 。 当 tty 核心 的 输入 缓冲 区 已 被 清空 时 ，unthrottle() 函 数 将 被 调用 以 暗示 设备 可 以 接收 
数据 。sop() 和 startO 函 数 非常 像 throttte0 和 unthrottle0 函 数 ， 但 它们 表示 tty 驱动 应 当 停止 发 送 数 
据 给 设备 以 及 恢复 发 送 数据 。 
tty 驱动 挂 起 tty 设备 时 ，hangup0O 函 数 被 调用 ， 在 此 函数 中 进行 相关 的 硬件 操作 。 
tty 驱动 要 在 RS-232 端口 上 打开 或 关闭 线路 的 BREAK 状态 时 ，break_ctl0 线 路 中 断 控 制 函 
数 被 调用 。 如 果 state 状态 设 为 -1，BREAK 状态 打开 ， 如 果 状 态 设 为 0，BREAK 状态 关闭 。 如 果 

这 个 函数 由 tty 驱动 实现 , 而 tty 核心 将 处 理 TCSBRK、TCSBRKP、TIOCSBRK 和 TIOCCBRK 这 

些 IOCTL 命令 。 

flush_bufferO 函 数 用 于 刷新 缓冲 区 并 丢弃 任何 剩 下 的 数据 。 

set_ldisc() 函 数 用 于 BA 路 规程 ， 当 tty 核心 改变 tty 驱动 的 线路 规程 时 这 个 函数 被 调用 ， 这 
个 函数 通常 不 需要 被 驱 

send_xchar() 为 X- 类 型 字符 发 送 函数 , 这 个 函数 用 来 发 送 一 个 高 优先 级 XON 或 者 XOFF 字符 
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给 tty 设备 ， 要 被 发 送 的 字符 在 第 2 个 参数 ch 中 指定 。 
read_proc() 和 write_proc() 为 /proc 读 和 写 函 数 。 
tiocmget() FK ZU T 3&8 tty 设备 的 线路 设置 ， 对 应 的 tiocemset() 
参数 set 和 clear 包含 了 要 设置 或 者 清除 的 线路 设置 。 
Linux 内 核 提 供 了 一 组 函数 用 于 操作 tty. driver 结构 体 及 tty 设备 ， 如 下 所 示 。 
(1) 分 配 tty 驱动 。 
struct tty driver *alloc tty driver(int lines); 
这 个 函数 返回 ty _driver 指针 ， 其 参数 为 要 分 配 的 设备 数量 ，line 会 被 赋值 给 tty_driver HJ num 成 员 。 
(2) 注册 tty 驱动 。 
Ine CEY- 
参数 为 由 alloc_tty_driver (分配 的 tty_driver 结构 体 指针 ， 注 册 tty 驱动 成 功 时 返回 0. 
(3) 注销 tty 驱动。 
int tty unregister driver(struct tty driver *driver); 
这 个 函数 与 tty register driver (对 应 ，tty 驱动 最 终 会 调用 上 述 函 数 注销 tty_driver。 
(4) 注册 tty 设备 。 


void tty register device(struct tty driver *driver, unsigned index, 



































于 设置 tty 设备 的 线路 设置 ， 
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register driver(struct tty driver *driver); 







































































struct device *device); 
A tty driver 是 不 够 的 ， 驱 动 必须 依附 于 设备 ，tty_register_device() 函 数 用 于 注册 关联 于 
tty driver 的 设备 ，index 为 设备 的 索引 范围 是 0~driver->num)， 如 : 


for (i O « XXX TTY MINORS; -*-i) 

tty register device(xxx tty driver, i, NULL); 

(50 注销 tty 设备 。 

void tty unregister device(struct tty driver *driver, unsigned index); 
上 述 函 数 与 tty register device Nz,. HIT TES tty 设备 ， 其 使 用 方法 如 : 
CR 二 人 

tty unregister device(xxx tty driver, i); 


(6) 设置 tty 驱动 操作 。 
void tty set operations(struct tty driver *driver, struct tty operations *op); 
上 述 函 数 会 将 tty_operations 结构 体 中 的 函数 指针 拷贝 给 tty. driver 对 应 的 函数 指针 。 
终端 设备 驱动 都 围绕 tty driver 结构 体 而 展开 ， 一 般 而 言 ， 终 端 设备 驱动 应 包含 如 下 组 成 。 
(1) 终端 设备 驱动 模块 加 载 函 数 和 仓 载 函数 ， 完 成 注册 和 注销 tty_driver， 初 始 化 和 释放 终端 
设备 对 应 的 tty_driver 结构 体 成 员 及 硬件 资源 。 
(2) 实现 tty operations 结构 体 中 的 一 系列 成 员 函 数 ， 主 要 是 实现 open(). close(). write(). 


tiocmsgetO 、tiocmsetO 等 函数 。 
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14.3 RELEE AAR 


14.3.4 RR pR ED E ES ZR 


tty 驱动 的 模块 加 载 函数 中 通常 需要 分 配 、 初 始 化 tty driver 结构 体 并 申请 必要 的 硬件 资源 ， 
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如 代码 清单 14.4。tty 驱动 的 模块 卸载 函数 完成 与 模块 加 载 函数 相反 的 工作 。 


代码 清单 14.4 ”终端 设备 驱动 模块 加 载 函 数 范例 
/* tty 驱动 模块 加 载 函数 * 


2. greckie abor — uen $95 (el 















































QUEE 

4 ... 

5 /* 分 配 tty driver 结构 体 */ 

6 xxx tty driver - alloc tty driver(XXX PORTS); 

7 /* 初始 化 tty driver 结构 体 */ 

8 xxx tty driver-»owner = THIS MODULE; 

9 xxx tty driver-»name - "ttyS"; 

0 xxx tty driver-»major = TTY MAJOR; 

t xxx tty driver-»minor start - 64; 

2 xxx tty driver-»type = TTY DRIVER TYPE SERIAL; 
3 xxx tty driver->subtype = SERIAL TYPE NORMAL; 
4 xxx tty driver-»init termios - tty std termios; 
5) xxx tty driver-»init termios.c cflag - B9600 | CS8 | CREAD | HUPCL | CLOCAL; 
6 xxx tty driver-»flags = TTY DRIVER REAL RAW; 

Y tty set operations(xxx tty driver, &xxx ops); 

8 

9 ret = tty register driver(xxx tty driver); 

20 FE ret) i 

21 printk(KERN ERR "Couldn't register xxx serial A eN 
22 put tty driver(xxx tty driver); 

2 return ret; 

24 ) 

23) 

26 TE 

27 ret = request irq(...); /* 硬件 资源 申请 */ 

28 

DOM 


14.3.2 JAFSKA ER ZR 


当 用 户 对 tty 驱动 所 分 配 的 设备 节点 进行 open0 系 统 调 用 时 ，tty_driver 所 拥有 的 tty. operations 
的 open0 成 员 函 数 将 被 tty 核心 调用 。tty 驱动 必须 设置 open0) 成 员 ， 否 则 ，-ENODEYV 将 被 返 
给 调用 open0 的 用 户 。 
open0) 成 员 函 数 的 第 1 个 参数 为 一 个 指向 分 配给 这 个 设备 的 tty_struct 结构 体 的 指针 ， 第 2 个 
参数 为 文件 指针 。 
tty struct 结构 体 被 tty 核心 用 来 保存 当前 tty 端口 的 状态 , 它 的 大 多 数 成 员 只 被 tty 核心 使 用 。 
tty_struct 中 的 几 个 重要 成 员 如 下 。 

C1) flags 标示 tty 设备 的 当前 状态 ， 包 括 TTY_THROTTLED、TTY IO ERROR, TTY OTHER - 
CLOSED. TTY EXCLUSIVE. TTY DEBUG. TTY DO WRITE WAKEUP. TTY PUSH, TTY . 
CLOSING, TTY DONT FLIP. TTY HW COOK OUT. TTY HW COOK IN. TTY PTY LOCK.、 
TTY NO WRITE SPLIT 等 。 

(2) ldisc 为 给 tty 设备 的 线路 规 和 

(3) write wait, read wait 为 给 tty 写 / 读 函数 的 等 待 队列 ，tty 驱动 应 当 在 合适 的 时 机 唤醒 对 
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应 的 等 待 队列 。 
(4) termios 为 指向 tty 设备 的 当前 termios 设置 的 指针 。 
(5) stopped:1 指示 是 否 停止 tty 设备 ，tty 驱动 可 以 设置 这 个 值 ，hw_stopped:1 指示 是 否 tty 
设备 已 经 被 停止 ，tty 驱动 可 以 设置 这 个 值 ，flow_stopped:1 指示 是 否 tty 设备 数据 流 停止 
(6) driver data. disc data 为 数据 指针 ， 用 于 存储 tty 驱动 和 线路 规程 的 “私有 ” um. 
驱动 中 可 以 定义 一 个 设备 相关 的 结构 体 , 并 在 open() 函 数 中 将 其 赋值 给 tty_struct 的 driver data 
成 员 ， 如 代码 清单 14.5。 


代码 清单 14.5 在 tty 驱动 打开 函数 中 赋值 tty. struct 的 driver. data 成 员 
/* 设备 “私有 ”数据 结构 体 */ 


eo 


























































































































1l 

2; ene. XXX iti qi 
3 struct tty struct *tty; /* tty struct i */ 
4 int open count; /* 打开 次 数 */ 

5 struct semaphore sem; /* 结构 体 锁定 信号 量 */ 
6 

E 

8 

9 

















intxmit buf; /* 传输 缓冲 区 */ 


j 





0 /* 打开 函数 */ 
SS) 
2 

GuEcUMOQ AOI EIL]. ESSERE 


3 
4 
S M sss EE 
6 xxx — kmalloc(sizeof(*xxx), GFP KERNEL); 
4l abi (iH sero) 

8 return - ENOMEM; 

9  /* 初始 化 xxx tty 中 的 成 员 */ 

20 init MUTEX(&xxx-»sem); 

21 xxx-»open count - 0; 








23  /* ib tty struct 中 的 driver data 指向 xxx tty */ 
24 tty-»driver data = xxx; 
25 xxx-»tty = tty; 


27 return 




































































在 用 户 对 前 面 使 用 open0 系 统 调用 而 创建 的 文件 句柄 进行 close & ZUR HH IST, tty. driver PT} 
有 的 tty_operations 中 的 close0 成 员 函 数 将 被 tty 核心 调用 。 


数据 发 送 和 接收 


图 14.3 所 示 终 端 设备 数据 发 送 和 接收 过 程 中 的 数据 流 以 及 函数 调用 关系 。 用 户 在 有 数据 发 送 
给 终端 设备 时 , 通过 “write0 系 统 调用 tty 核心 见 程 ” 的 层 层 调用 , 最 终 调用 tty. driver 
结构 体 中 的 writeO 函 数 完成 发 送 
习 为 传输 速度 和 tty 硬件 缓冲 区 容量 的 原因 ， 不 是 所 有 的 写 程序 要 求 的 字符 都 可 以 在 









































































































































































































































调用 写 
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函数 时 被 发 送 ， 因 此 写 函 数 应 当 返 回 能 够 发 送 给 硬件 的 字 节 数 以 便 用 户 程序 检查 是 否 所 有 的 数据 
被 真正 写 入 。 如 果 在 writeO 调 用 期 间 发 生 任何 错误 ， 一 个 负 的 错误 码 应 当 被 返回 
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户 空 间 
write() read() 
tty 核 A X 
tty write() tty read() 

m" i 

Idisc.write() Idisc.read() 

ttyZET | Idisc.receive buf() 

tty 驱 动 加 À 

driver.write() tty flip buffer push() 

flip buffer 7 
中 断 处 理 函 数 

硬件 层 




















数据 流 ” 一 一 一 函数 调 











图 14.3 终端 设备 数据 发 送 和 接收 过 程 中 的 数据 流 和 郴 数 调用 关系 

















tty driver 的 writeO 函 数 接受 3 个 参数 tty_struct、 发 送 数据 指针 及 要 发 送 的 字 节 数 ， 一 般 首 先 
会 通过 tty_struct 的 driver. data 成 员 得 到 设备 私有 信息 结构 体 , 然后 依次 进行 必要 的 硬件 操作 开始 
发 送 ， 代 码 清单 14.6 为 tty_driver 的 write) PK I 18 9] 





















































代码 清单 14.6 tty. driver 结构 体 的 write() 成 员 函 数 范例 

















SEE 
ao i 

3 /* 获得 tty 设备 私有 数据 */ 

4 serue xx Cey xxx o SiEuctexxxetty eey driver data; 

5 E 

6  /* JFBARXE */ 

gi while (1) { 

8 local_irq_save (flags); 

9 E = moe (abs roomie oin en SA = oeae cu = ly 
0 SERIAL XMIT_SIZE = xxx->xmit_head)); 

y 

2 d (que c y 4 

3 local irq restore(flags); 

4 break; 

5 } 

6 /* 拷贝 到 发 送 缓冲 区 */ 

T memcpy(xxx-»xmit buf -* xxx-»xmit head, buf, c); 

8 xxx-»xmit head —- (xxx-»xmit head * c) &(SERIAL XMIT SIZE - 1); 
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19 Xxx wb (eiue. F= C} 

20 local irq restore(flags); 
gi 

22 buf *- c; 

3 QOUHE) = 0I 

24 POLAT dre ep 

25 } 

26 
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2i if (xxx-»xmit cnt && !tty-»stopped && !tty-»hw stopped) 
28 start omit (xxx);/* JP AXE */ 
/* 返回 发 送 的 字 节 数 */ 


29 return total; 


EON 























当 tty 子 系统 自己 需要 


























发 送 数 据 到 tty 设备 时 ， 











如 果 没 有 实现 put_char() 函 数 ，write0 函 数 将 被 


调用 ， 此 时 传 入 的 count 参数 为 1， 通 过 对 代码 清单 14.7 的 分 析 即 可 获知 。 
代码 清单 14.7 put. char() 函 数 的 write() 替 代 


























1 int tty register driver(struct tty driver *driver) 

2. 3 

3 T 

4 if (!driver-»put char)//iXfisE X put char () 函数 

5 driver-»put char - tty default put char; 

6 HOP 

3 

9 aite C voie tey Cei Ui eSI UC e DI SIEG EE VES SIE UG E YS nece cha c) 
Be 

10 tty->driver->write (tty，&ch，1);// 调 用 tty driver.write() 函数 


d d 





读者 朋友 人 




















] 
动 的 ， 而 接收 即 用 户 调 read0 则 是 读 一 片 缓冲 区 ， 
flip buffer 的 结构 体 中 缓冲 数据 直到 它 被 用 








POTE 
Hj H&TE 3 











Bl f, tty operations 结构 体 中 没有 提供 read0 函 数 。 因 为 发 送 是 
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已 放 好 的 数据 。tty 核心 在 一 个 称 为 struct tty_ 
























































驱动 并 非 一 定 要 实现 它 

















tty 驱动 不 必 过 于 关心 tty. flip buffer 结构 体 
FLIPBUF_SIZE， 这 个 flip 缓冲 
































身 的 缓冲 逻辑 。 



































站 请 求 。 因 为 tty 核心 提供 了 缓冲 逻辑 ， 因 此 每 个 tty 














的 细节 ， 如 果 其 count 字段 大 于 或 等 于 TTY 

















调用 来 完成 ， 代 码 清单 14.8 给 出 了 范例 。 














代码 清单 14.8 


geag (uno (p 3c ako SOLUS ls) 











区 就 需要 被 刷新 到 























JP, MANEX tty flip buffer pushO 函 数 的 

















tty. flip. buffer. push() 范 例 


{ 


EE nn I 


tty flip buffer push(tty) 
dara Lat pos 


} 


1l 
2 
3 
4 Ev im eh 
5 
6 


ica ne Estoy TejbtenE eri puSN EE) 
从 tty 驱动 接收 到 字符 将 被 tty_insert_flip_char0 函 数 插 入 flip 缓冲 区 。 该 函数 的 第 1 个 参数 是 
数据 应 当 保存 入 的 tty_struct 结构 体 ， 第 2 个 参数 是 要 保存 的 字符 ,第 3 个 参数 是 应 当 为 这 个 字符 



































设置 的 标志 ， 如 果 字 符 是 
依据 具体 的 错误 





的 指示 错误 的 字符 ， 
TTY OVERRUN. 





;/* 数据 填 满 向 上 层 “ 推 ”*/ 
TTY NORMAL); /* 把 数据 插入 缓冲 





E 





"d 














个 接收 到 的 常规 字符 ， 则 设 为 TTY NORMAL， 如 果 是 一 个 特殊 类 型 





























类 型 ， 


应 当 设 为 TTY BREAK. TTY PARITY 或 
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14.5 Tv 线路 设置 


14.5.1 线路 设置 用 户 空 间接 口 
用 户 可 用 如 下 两 种 方式 改变 tty 设备 的 线路 设置 或 者 获取 当前 线路 设置 。 
1. 调用 用 户 空间 的 termios 库 函 数 
用 户 空间 的 应 用 程序 需 引用 termios.h 头 文件 ， 该 头 文件 包含 了 终端 设备 的 IO 接口 ， 实 际 是 
由 POSIX 定义 的 标准 方法 。 对 终端 设备 操作 模式 的 描述 由 termios 结构 体 完 成 ， 从 代码 清单 142 
可 以 看 出 ， 这 个 结构 体 包含 c_iflag、c_oflag、c_cflag、c_lflag 和 c_cc[] 几 个 成 员 。 
termios 的 c_cflag 主要 包含 如 下 位 域 信息 : CSIZE ( 字 长 )、CSTOPB (两 个 停止 位 )、PARENB 
(奇偶 校 验 位 使 能 )、PARODD ( 奇 校 验 位 ， 当 PARENB 被 使 能 时 )、CREAD (字符 接收 使 能 ， 
如 果 没 有 置 位 ， 仍 然 从 端口 接收 字符 ， 但 这 些 字符 都 要 被 丢弃 )、CRTSCTS〔 如 果 被 置 位 ， 使 能 
CTS 状态 改变 报告 )、CLOCAL (如 果 没 有 置 位 ， 使 能 调制 解 调 器 状态 改变 报告 )。 
termios 的 c iflag 主要 包含 如 下 位 域 信息 : INPCK (使 能 帧 和 奇偶 校 验 错误 检查 )、BRKINT 
(break 将 清除 终端 输入 /输出 队列 ， 向 该 终端 上 前 台 的 程序 发 出 SIGINT 信号 )、PARMRK (奇偶 
校 验 和 帧 错误 被 标记 ， 在 INPCK 被 设置 有 IGNPAR 未 被 设置 的 情况 下 才 有 意义 )、IGNPAR CA 
略 奇偶 校 验 和 帧 错误 )、IGNBRK (忽略 break). 
通过 tcgetattrO、tcsetattr0 函 数 即 可 完成 对 终端 设备 的 操 { 
原型 如 下 : 


int tcgetattr (int fd, struct termios *termios p); 
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模式 的 设置 和 获取 ， 这 两 个 函数 的 






































int tcsetattr (int fd, int optional actions, struct termios *termios p); 


例如 ，Raw 模式 的 线路 设置 如 下 。 

e dk BEN. 

e 关闭 回 显 。 
E CR 到 NL 的 映射 ICRNL)、 输 入 奇偶 校 验 、 输 入 第 8 位 的 截取 CISTRIPO. 以 及 输 

出 流 控 制 。 

e 8 位 字符 (CS8)， 奇 偶 校 验 被 禁止 。 

e 禁止 所 有 的 输出 处 理 。 

e 每 次 一 个 字 节 (c_cc [VMIN] = Il. e ec [VTIME] = 

则 对 应 的 对 termios 结构 体 的 设置 就 为 : 


termios p-»c iflag &- ~(IGNBRK | BRKINT | PARMRK | ISTRIP 
| ammuójer: Jp aee: || uera || ON 










































































zl 


P 


termios p-»c oflag &= -OPOST; 















































termios p-»c lflag &= -(ECHO | ECHONL ICANON | ISIG | IEXTEN); 
termios p >c cflag &-2 -(CSIZE | PARENB); 

termios-ps*e oflag [e CS8y 

通过 如 下 一 组 函数 可 完成 输入 /输出 波 特 率 的 获取 和 设置 : 

speed t cfgetospeed (struct termios *termios p); // 获 得 输出 波 特 率 
speed t cfgetispeed (struct termios *termios p); // 获 得 输入 波 特 率 
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int cfsetospeed (struct termios *termios p, speed t speed); // 设 置 输出 波 特 率 

int cfsetispeed (struct termios *termios p, speed t speed); // 设 置 输入 波 特 率 

如 下 一 组 函数 则 完成 线路 控制 |: 

int tcdrain (int fd); // 等 待 所 有 输出 都 被 发 送 
int tcflush (int fd, int queue selector); / / £1ush 输入 /输出 缓冲 区 
int tcflow (int fd, int action); // 对 输入 和 输出 流 进行 控制 
int tcsendbreak (int fd, int duration); // 发 送 break 

tcflush 函数 刷 清 (抛弃 〉 输 入 缓冲 区 (终端 驱动 程序 已 接收 到 ， 但 用 户 程 序 尚未 读 取 ) 或 输 










































































— 


TCOFLUSH (〈 刷 清 输 出 队列 ) s& TCIOFLUSH 〈 刷 清 输入 、 输 出 队列 )。 























tcflow0O 对 输入 输出 进行 流 控制 ，action 参数 可 取 TCOOFF 〈 输 出 被 挂 起 )、TCOON (8 
动 以 前 被 挂 起 的 输出 )、TCIOFF (发 送 1 个 STOP 字符 ， 使 终端 设备 暂停 发 送 数据 )、TCION € 











送 1 个 START 字符 ， 使 终端 恢复 发 送 数据 )。 
































出 缓冲 区 (用 户 程序 已 经 写 ， 但 驱动 尚未 发 送 )，queue 参数 可 取 TCIFLUSH 〈 刷 清 输入 队列 )、 








REO 还 


tcsendbreak() 函 数 在 一 个 指定 的 时 间 区 间 内 发 送 连 续 的 二 进位 数 0。 若 duration 参数 为 0， 则 








此 种 发 送 延续 0.25—0.5 秒 。POSIX.1 说 明知 duration 非 0， 则 发 送 时 间 依 赖 了 


2. Xj tty 设备 节点 进行 ioctl() 调 用 

















F 实现 。 


大 部 分 termios 库 函 数 会 被 转化 为 对 tty 设备 节点 的 ioctl0 调 用 ， 例 如 tegetattrO, tcesetattrO 











数 对 应 着 TCGETS、TCSETS IO 控制 命令 。 

















TIOCMGET (获得 MODEM 状态 位 )、TIOCMSET (设置 MODEM 状态 位 )、TIOCMBIC 








(清除 指示 MODEM 位 )、TIOCMBIS (设置 指示 MODEM 位 ) 这 4 个 VO $255 





H 


| 





命令 
































置 MODEM 握手 ， 如 RTS, CTS, DTR, DSR, RI, CD 等 。 


14.5.2 tty 驱动 set termios EG 




















大 部 分 termios 用 户 空间 函数 被 库 转 换 为 对 驱动 节点 的 ioctl0 调 用 ， 而 tty ioctl ! 





获取 和 设 








的 大 部 分 











命令 会 被 tty 核心 转换 为 对 tty 驱动 的 set_termios() 函 数 的 调用 。set_termios() 函 数 需 要 根据 





























JP 

















termios 的 设置 (termios 设置 包括 字 长 、 奇 偶 校 验 位 、 停 止 位 、 波 特 率 等 ) 完成 实际 的 硬件 设置 。 























tty operations 中 的 set_termios() 函 数 原型 为 : 


siejatrel (Coistexe- mono (eo Dl no ne ee (en viollel) p 





































































































新 的 设置 被 保存 在 tty. struct 中 ， 旧 的 设置 被 保存 在 old 参数 中 ， 若 新 旧 参 数 相同 ， 则 什么 都 不 


需要 做 ， 对 于 被 改变 的 设置 ， 需 完成 硬件 上 的 设置 ， 代 码 清单 14.9 给 出 了 set termiosO) 函 数 的 例子 。 

















代码 清单 14.9 tty 驱动 程序 set. termios() 函 数 范例 








A 

3 struct xxx tty *info - (struct cyclades port*)tty-»driver data; 
4 /* 新 设置 等 同 于 老 设 置 ， 什 么 也 不 做 */ 

8 if (tty-»termios-»c cflag -- old termios-»c cflag) 

6 return 2 

Ji 

8 

9 /* 关闭 CRTSCTS 硬件 流 控制 */ 

10 ie (N(R mS orle] UG ss (emi omae) 4 

dicil 


Sibi CV OC Se tote s(t et ct vis cme tl Ev Serut Termos .oleenmles) 








oo 
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} 











2 
3 
4 /* 打开 CRTScTS 硬件 流 控制 */ 

5 if (l(old termios-»c cflag &CRTSCTS) && (cflag &CRTSCTS)) ( 
6 

7 

8 





} 





9 /* 设置 字 节 大 小 */ 
20 Switch (tty-»termios-»c cflag &CSIZE) ( 
Zl case CS5: 





28 Ee ee 

zb RAE 

21 zee G: 

29 

31  /* 设置 奇偶 校 验 */ 


92 if (tty-»termios-»c cflag &PARENB) 
33 if (tty-»termios-»c cflag &PARODD) /* 奇 校 验 */ 





35 else /* 偶 校 验 */ 
37 else /* JM / 
s] 


14.5.3 tty 驱动 的 tiocmget 和 tiocmset ER žr 

对 TIOCMGET., TIOCMSET. TIOCMBIC 和 TIOCMBIS IO 控制 命令 的 调用 将 被 tty 核心 转 
换 为 对 ty 驱动 tiocmgetO 函 数 和 tiocmsetO 函 数 的 调用 ，TIOCMGET 对 应 tiocmget() K žit, 
TIOCMSET、TIOCMBIC 和 TIOCMBIS 对 应 tiocmsetO 函 数 ， 分 别 用 于 读 取 Modem 控制 的 设置 和 
进行 Modem 的 设置 .代码 清单 14.10 所 示 为 tiocmgetO 函 数 的 范例 ,代码 清单 14.11 Br 73 tiocmset() 
函数 的 范例 。 




















































































































代码 清单 14.10 tty 驱动 程序 tiocmget() 函 数 范例 


eeaeee aiie SSS tenet (rue et eaae .ey See ene 











2T 

3 struct xxx tty *info - tty-»driver data; 

4 unsigned int result - 0; 

5 unsigned int msr - info-»msr; 

6 unsigned int mcr - info-»mcr; 

y result —- ((mer &MCR DTR) ? TIOCM DTR : 0) | /* DTR WB */ 
8 ((mcr &MCR RTS) ? TIOCM RTS : 0) | /* RTS 被 设置 */ 

9 ( (mcr &MCR LOOP) ? TIOCM LOOP : 0) | /* LOOP 被 设置 */ 
10  ((msr &MSR CTS) ? TIOCM CTS : 0) | Æ cTS MH */ 
11  ((msr &MSR CD) ? TIOCM CAR : 0) | /* CD kuen 

12  ((msr &MSR RI) ? TIOCM RI : 0) | /* 振 铃 指示 被 设置 */ 
13  ((msr &MSR DSR) ? TIOCM DSR : 0); /* DSR Mb */ 


14 return result; 





下 IINUX; 
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代码 清单 14.11 tty 驱动 程序 tiocmset() 函 数 范例 











JL recria boe osses etone (oraber ce Se uoe Seo re oile erile, ne 
2 int set, unsigned int clear) 

3 4 

4 struct xxx tty *info - tty-»driver data; 
5 unsigned int mcr - info-»mcr; 

6 

7 if (set &TIOCM RTS) /* WERTS */ 

8 mcr |- MCR RTS$S; 

9 if (set &TIOCM DTR) /* WXEIDTR */ 

0 mcr |= MCR RTS; 

al 

2 if (clear &TIOCM RTS) /* 清除 RTS */ 

3 mcr &- ~MCR RTS; 

4 if (clear &TIOCM DTR) /* il DTR */ 

S mcr &- -«MCR RTS; 

6 

7 /* 设置 设备 新 的 MCR IH */ 

S  Bbinycomeor — mor. 

9 return 0; 
ZONE 


tiocemget0) 函 数 会 访问 MODEM 状态 寄存 器 (MSR), M tiocemsetO) 函 数 会 访问 MODEM 12:1 
寄存 器 (MCR). 


14.5.4 tty 驱动 ioctl ER2X 
当 用 户 在 tty 设备 节点 上 进行 ioctl0 调 用 时 ，tty_operations 中 的 ioctl0 函 数 会 被 tty 核心 调用 。 
如 果 tty 驱动 不 知道 如 何 处 理 传递 给 它 的 IOCTL 值 ， 它 返回 -ENOIOCTLCMD, 之 后 tty 核心 会 执 
行 一 个 通用 的 操作 。 

驱动 中 常见 的 需 处 理 的 IO 控制 命令 包括 TIOCSERGETLSR (获得 这 个 tty 设备 的 线路 状态 
寄存 器 LSR 的 值 )、TIOCGSERIAL (获得 串口 线 信息 )、TIOCMIWAIT 等待 MSR 改变 )、 
TIOCGICOUNT (获得 中 断 计 数 ) 等 。 代 码 清单 14.12 给 出 了 tty 驱动 程序 ioctl0 函 数 的 范例 。 


代码 清单 14.12 tty 驱动 程序 ioctl() 函 数 范例 





di 
p—s 



































































































































































































































Il ene me tac > oy el (Se ee ov Nee ee one elle el in le 
2 cmd, unsigned long arg) 

SET 

4 struct xxx tty "*info - tty-»driver data; 
5) 

6 /* 处 理 各 种 命令 A 

7 switch (cmd)( 

8 case TIOCGSERIAL: 

9 xs 

KO case TIOCSSERIAL: 

Abb na 

dg case TIOCSERCONFTIG: 

Le « 

14 case TIOCMIWAIT: 

LS is 

16 case TIOCGICOUNT: 
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18 case TIOCSERGETLSR: 











m 
n 
| 
i 


竺 定 的 UART 设备 驱动 完全 可 以 遵循 第 142—14.5 节 的 方法 来 设计 ， 即 定义 
tty driver 并 实现 tty operations 其 中 的 成 员 函 数 ， 但 是 Linux 已 经 在 文件 serial core.c 中 实现 了 
UART 设备 的 通用 tty 驱动 层 〈 姑 且 称 其 为 串口 核心 层 )， 这 样 ，UART 驱动 的 主要 任务 演变 成 实 
现 serial-core.c 中 定义 的 一 组 uart_xxx 接口 而 非 tty_xxx 接口 ， 如 图 14.4 所 示 。 




































































































fs/char. dev.c 


注册 字符 设备 


struct file_operations 












tty_register_ldisc () 
struct tty disc 





uart. register driver () 
Struct uart ops 








Ooooo 
Dooo 


14.4 ”串口 核心 层 








serial core.c 串口 核心 层 完全 可 以 被 当 作 14.2 一 14.5 节 tty 设备 驱动 的 实例 ， 它 实现 了 UART 
设备 的 tty 驱动 。 回 过 头 来 再 看 12.2 节 “ 设 备 驱动 的 分 层 思 想 ”， 是 否 更 加 座 然 开朗 ? 

串口 核心 层 为 串口 设备 驱动 提供 了 如 下 3 个 结构 体 。 

1. uart driver 

uart driver 包含 串口 设备 的 驱动 名 、 设 备 名 、 设 备 号 等 信息 ， 它 封装 了 tty_driver， 使 得 底 
的 UART 驱动 无 需 关 心 tty_driver， 其 定义 如 代码 清单 14.13 所 示 。 





















































NII 






































代码 清单 14.13 uart_driver 结构 体 


dL Struct uart ohebwuewc. d 

2 struct module *owner; 

3 const char *driver name; /* Ukzjjz */ 
4 const char *dev name; /* 设备 名 */ 
5 int major; /* 主 设备 号 */ 

6 int minor; /* 次 设备 号 */ 
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© 
o 
Ji ae Seld Q 
8 struct console *cons; 
9 
10 /* 私有 的 ， 底 层 驱 动 不 应 该 访问 这 些 成 员 ， 应 该 被 初始 化 为 NULL */ 
d srrauctoudartostate *state 
T2 struct tty driver *tty driver; 
iS $5 
一 个 tty 驱动 必须 注册 /注销 tty_driver， 而 一 个 UART 驱动 则 演变 为 注册 /注销 uart. driver, fi 
用 如 下 接口 : 
int uart register driver(struct uart driver *drv); 
void uart unregister driver(struct uart driver *drv); 
实际 上 ，uart register driver() l uart unregister driver() PFA JJ] Gh t | tty register driver() 和 
tty_unregister_driver() 的 操作 ， 如 代码 清单 14.14 所 示 。 
代码 清单 14.14 uart register driver()&l uart unregister driver()E& Zi 
1 int uart register driver(struct uart driver *drv) 
2 A 
3 struct tty driver *normal - NULL; 
4 inei retval 
5 
6 BUG ON (drv-»state); 
qi 
8 drv-»5state - kzalloc(sizeof(struct uart state) * drv-»nr, GFP KERNEL); 
G retval = -ENOMEM; 
0 atr. (UI obest eter tE S) 
JL goto out; 
2 
3 normal = alloc tty driver (drv-»nr); 
4 if (!normal) 
5) goto out; 
6 
jJ drv-»tty driver - normal; 
8 /* 初始 化 tty_qriver */ 
9 normal-»owner = drv-»owner; 
20 normal-»driver name = drv-»driver name; 
21 normal->name = drv->dev_name; 
22 normal->major = drv->major; 
DE normal-»minor start = drv-»minor; 
24 normal-»type —UTPY-DRIVER-TYPE-SERTADBN; 
2 normal-»subtype = SERIAL TYPE NORMAL; 
26 normal-»init termios = tty std termios; 
27 normal AIN er an Lo emer Rae = Meena ere EC REAPARECE (COA 
28 normal->init termios.c ispeed = normal->init termios.c ospeed = 9600; 
29 normal->flags = TTY DRIVER REAL RAW | TTY DRIVER DYNAMIC DEV; 
30 normal-»driver state = drv; 
31 tty set operations(normal, &uart ops); 
32 
33 /* 初始 化 UART 状态 */ 
34 for (Te mP e Arne AREN T 
33 struct uart state *state = drv->state + i; 
36 
37 state-»close delay - 500; J al. Sl ey 
38 state-»closing wait = 30000; Jv 30 baconi / 
IINUX, 321 
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39 

40 mutex init(&state-»mutex); 
41 } 

42 

43 retval = tty_register_driver (normal); 
44 out: 

45 if (retval « O) ( 

46 put tty driver (normal); 

47 kfree (drv->state); 

48 } 

49 return retval; 

SO. y 

51 


52 void uart unregister driver(struct uart driver *drv) 
53. 















































54 struct tty driver *p = drv->tty_driver; 

59 tty unregister driver (p); 

56 put tty driver(p); 

51 kfree(drv-»state); 

58 drv-»tty driver = NULL; 

S9 

2. uart port 

uart port 用 于 描述 一 个 UART 端口 (直接 对 应 于 一 个 串口 









































大 小 、 端 口 类 型 等 信息 ， 其 定义 如 代码 清单 14.15. 














代码 清单 14.15  uart. port 结构 体 


Struct vart port Ti 
spinlock t lock; /* 端口 锁 */ 
unsigned int iobase; /* 工 /0 端 号 基地 址 */ 
char _ iomem *membase; /* 1/0 内 存 基地 址 */ 
int irq; /* 终端 号 */ 
int uartclk; /* UART 时 钟 */ 
char fifosize; /* 传输 fifo 大 小 */ 
unsigned char x char; /* xon/xoff 字符 */ 
c 
c 
c 





























unsigned 


unsigned 





F 

2 

3 

4 

5 unsigned 
6 

7 unsigned 
8 

9 












































unsigned char regshift; /* 寄存 器 位 移 */ 
0 unsigned char iotype; /* IT/O 存 取 类 型 */ 
T unsigned char unusedl1; 
2 
3 unsigned int read status mask; /* 驱动 相关 的 */ 
4 unsigned int ignore status mask; /* 驱动 相关 的 */ 
5 struct uart info *info; /* HP parent fik */ 
6 struct uart icount icount; /* iXX */ 
Ji 
8 struct console *cons; /* console 结构 体 */ 
9 #ifdef CONFIG SERIAL CORE CONSOLE 
20 unsigned long sysrq; /* sysrq 超时 */ 
21 #endif 
22 
23 Wüjenr "p ae lA 
24 unsigned int mctrl; /* 目前 modem 控制 设置 */ 
25 unsigned int timeout; /* 基于 字符 的 超时 */ 
26 unsigned int type; /* 端口 类 型 */ 
27 const struct uart ops *ops; /* UART 操作 集 */ 





) 的 IO 5 


"m 
i 





el 














或 IO 内 存 地 址 、FIFO 
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28 unsigned int custom divisor; 














29 unsigned int line; ls 





30 unsigned long mapbase; /* ioremap 后 基地 址 */ 
31 struct device *dev; /* parent 设备 */ 

32 unsigned char hub6; 

93 unsigned char suspended; 

34 unsigned char unused[2]; 

35 void *private data; 

36 ); 


串口 核心 层 提供 如 下 函数 来 添加 一 个 端口 : 
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int uart add one port(struct uart driver *drv, struct uart port *port); 



































对 上 述 函 数 的 调用 应 该 发 生 在 uart register driver()Z.JH, uart add one portO fj — 3 8 





用 是 封装 了 tty register device(). 


mn 





要 作 





























uart add_one_ port0 的 “有 反 函 数 ” 是 uart remove one port(), 其 ! 
原型 为 : 


调 








J tty_unregister_device(), 


int uart remove one port(struct uart driver *drv, struct uart port *port); 


3. uart ops 


uart ops 定义 了 针对 UART 的 一 系列 操作 ， 包 括 发 送 、 接 收 及 线路 设置 等 ， 如 果 说 tty_driver 










































































中 的 tty_operations 对 于 串口 还 较为 抽象 ， 那 么 uart_ops 则 直接 面向 了 串口 的 UART， 其 定义 如 代 






































码 清单 14.16。Linux 驱动 的 这 种 层次 非常 类 似 于 面向 对 象 编程 中 基 类 、 派 生 类 的 关系 ， 派 生 类 针 















































对 特定 的 事物 会 更 加 具体 ， 而 基 类 则 站 在 更 高 的 抽象 层次 上 。 


代码 清单 14.16 uart ops 结构 体 
















































































To SELUCE iweuete OPSI 

2 unsigned int (*tx empty) (struct uart port *); 

B void Cest nowel (cece tebr pone ln ton el sbshe eh eal 
4 unsigned int (ra etl) (Ss et Ot 

5 void (csse tes) flete ere ignei. oie 7) 5 

6 void (St nt (tu 

d void Gcendixchariii Struc ouart ipponta ehar elo) p 

8 void (ED Tigaci Joxoneie 59) p 

9 void (*enable ms) (struct uart port *); 

0 void (人 

i stant (Een Struct Wigs qoxeae "E 

2 void (*shutdown) (struct uart port *); 

3 void (Ce Le oe ene) (een vel oe 9) p 

4 void (*set termios) (struct uart port *, struct ktermios *new, 
5 struct ktermios *old); 

6 void Geane eiee (ee wee. joxoscie ae 

3i void (*pm) (struct uart port *, unsigned int state, 

8 unsigned int oldstate); 
9 TE (*set wake) (struct uart port *, unsigned int state); 
20 

2l const char *(*type) (struct uart port *); /*—"^jfüxsumL12S2 ER */ 

po /* 释放 该 端口 使 用 的 1/0 £l memory 资源 */ 

23 void (*release port) (struct uart port *); 

24 

2/5 /* 申请 该 端口 使 用 的 1/0 和 memory 资源 */ 

26 Lag (*request port) (struct uart port *); 

27 void (eon em er (secme Wennet "no ame) 





INUX 





oo 
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324 


28 int 
29 nme Groec) (erruet vere port stn int vnsimne dou) p 
30 #ifdef CONFIG CONSOLE POLL 


(aene (SS Let Out "eo. Cue Su 


SN void (*poll put char) (struct uart port *, unsigned char); 
3 UE (ere 1E eyes. ln 人 Co) 

33 #endif 

34 Y; 


serial core.c 中 定义 了 
uart send. xchar()55: X, n E 2c. Cap [C33 14.17)， 这 些 函 数 会 借助 uart ops 结构 体 ! 



























































tty operations 的 实例 ， 包 含 uart open(). uart close(). uart write(). 


的 成 员 函 数 






























































来 完成 具体 的 操作 , 代码 清单 14.18 所 示 为 tty_operations 的 uart_send_xchar0O 成 员 函 数 利 上 
中 start tx0、send_xchar0 成 员 函 数 的 例子 。 




















代码 清单 14.17 串口 核心 层 的 tty operations 实例 
Mra ire Consti et ev ODL t rons Mare Opsi 
2 . open = uart_open, 
i$ .close = uart close, 
4 .write = uart write, 
3 eje: Ghar = uart put ehar; 
6 ns (elei is) = uart flush chars, 
7 .write room = uart write room, 
8 .chars in buffer uart chars in buffer, 
9 .flush buffer = uart flush buffer, 

0 Toet - uart ioctl, 

3 .throttle = uart throttle, 

2 .unthrottle = uart unthrottle, 

3 .send_xchar = uart send xchar, 

4 .Set termios = uart set termios, 

5 .Set ldisc = uart set ldisc, 

6 .stop = uart stop, 

di eal - uart start, 

8 .hangup = uart hangup, 

9 .break ctl = uart break ctl, 
20 .Wait until sent- uart wait until sent, 
21 4ifdef CONFIG PROC FS 
22 .read proc = uart read proc, 
23 #endif 
24 .tiocmget = uart tiocmget, 
25 .tiocmset = uart_tiocmset, 
26 #ifdef CONFIG_CONSOLE_POLL 
Zu POINTA - uart poll init, 
28 .poll get char = uart poll get char, 
29 cjexouk.ll js, (elsueus = uart poll put char, 
30 #endif 
31 yz 


代码 清单 14.18 ”串口 核心 层 的 tty_operations 5 uart ops 关系 
Gheeeaslie swell "ven tn Wd ed ev ety Struct a GEN 
{ 
struct uart state *state = tty->driver_data; 
Struct uart port *port - state-»port; 


char ch) 


unsigned long flags; 
/* 如 果 uart ops 中 实现 了 send xchar 成 员 函 数 */ 
if (port-»ops-»send xchar) 





e ON QV MS oO Bo e 


iuart ops 








INUX 


动 的 情况 初始 





8 port-»ops-»send xchar(port, ch); 
9 else ( /* uart ops 中 未 实现 send xchar 成 员 函 数 */ 


ie (Ca) 4 


} 





le Ro jet x 


T ES 











pört->x Char = €h} 


Spin lock irqsave(&port-»lock, flags); 
port-»ops-»start tx(port); /* 发 送 xchar */ 
spin unlock irqrestore(&port-»lock, flags) 




















在 使 用 串口 核心 层 这 个 通用 中 
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O tty 驱动 层 的 接口 后 ， 一 个 串口 驱动 要 完成 的 主要 工作 如 下 。 




















CI) 定义 uart_driver、uart_ops、uart_port 等 结构 体 的 实例 并 在 适当 的 地 方 根据 具体 硬件 和 驱 





























Lu] SAR 


xxx uart ops. xxx uart port 之 内 。 














(2) 在 模块 初始 化 时 调 
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C3) 根据 具体 硬件 的 datasheet 实现 uart. ops : 


的 主体 工作 。 








区 ， 


在 Linux 内 核 ! 


























而 /proc/kmsg 文件 








—À 





> printk() 











] uart register driver()fll uart_add_one_port0 以 注册 UART 驱动 并 添加 端 
>, TERRI SIN] UE H] uart unregister driver()4ll uart remove one port) LEH UART 驱动 并 移 除 
































在 运行 ， 它 将 获取 内 核 消息 并 分 发 给 syslogd. syslogd 接着 检查 















































体 设备 xxx 的 驱动 可 以 将 这 些 结构 套 在 新 定义 的 xxx_uart_driver、 





























的 成 员 函 数 ， 这 些 函 数 的 实现 成 为 UART 驱动 


1 4. f printk 和 early printk console 驱动 


函数 是 最 常用 的 调试 手段 。printk0 的 打印 消息 会 放 入 一 个 环形 缓冲 
于 描述 这 个 缓冲 区 。 通 过 dmesg 命 
用 户 空间 的 klogd 守护 进程 
letc/syslog.conf 来 找 出 如 何 处 理 它们 。 

内 核 printk 信息 支持 8 个 级 别 ， 从 高 到 




















令 或 klogd 可 以 读 取 该 缓冲 区 。 如 果 


























氏 分 别 是 : KERN EMERG, KERNEL ALERT. 


KERN CRIT. KERN ERR, KERN WARNING. KERN NOTICE. KERN INFO. KERN_DEBUG. 


























当 调 用 printk() ER ZSCISE TS x BR D 26 Zo T- HR XE BU d | 606762 console loglevel 时 ， 调 试 消 息 就 显 


示 在 控制 台 终端 。 缺 省 的 console loglevel ff 
sys syslog 或 klogd-c 来 修改 console loglevel 值 ， 也 可 以 直接 echo 值 到 /proc/sys/ 




























































































是 DEFAULT CONSOLE LOGLEVEL， 用 户 可 以 使 




































































用 系统 调用 
kernel/printk。/proc/sys/kernel/printk 文档 包含 4 个 整数 值 ， 前 
先 级 。 

在 Linux "P, HF printk 输出 的 是 内 核 console， 专 门 
单 14.19 所 示 。 























两 个 表示 系统 当前 的 优先 级 和 缺 省 优 























用 console 结构 体 来 描述 ， 如 代码 清 

















代码 清单 14.19 用 于 printk 的 console 结构 体 


JL vehpxewieiE Xem t 

2 char name[16]; 

3 void (*write) (struct console *, const char *, unsigned); 
4 Xp (*read) (struct console *, char *, unsigned); 

5 Struc tite yl EV eS C tE CONSO lS «ape re 
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6 void (*unblank) (void); 

q int (Cserna) (Stern console vj Ges vp 
8 align: (*early setup) (void); 

$) shore flags; 

10 short index; 

AN int celad 

站 多 void *data; 

13) struct console *next; 
















































































其 中 ， 较 关键 的 是 write0 和 setup0 成 员 函 数 ， 前 者 用 于 将 打印 消息 写 入 console， 后 者 用 于 设 
置 console 的 特性 ， 如 波 特 率 、 停 止 位 等 。 

printk() 函 数 经 过 重重 调用 ， 经 过 ”call_ console_drivers() 函 数 ， 最 终 调用 console 的 write0) 成 
员 函 数 将 控制 台 消息 打印 出 去 ， 如 代码 清单 14.20 所 示 。 


代码 清单 14.20 ”printk() 最 终 调用 到 console 的 write() 成 员 函 数 



































im 






































YY 

















1 static void | call console drivers(unsigned start, unsigned end) 

Zr 4i 

3 struct console *con; 

4 

5 for (con = console drivers; con; con = con-»next) 4 

6 if ((con-»flags & CON ENABLED) && con-»write && 

3 (cpu online(smp processor id()) |l 
8 (con-»flags & CON ANYTIME))) 

9 con-»write(con, &LOG BUF(start), end - start); 
10 } 

ig 



































内 核 提 供 如 下 API 用 于 注册 和 注销 console: 


void register console(struct console *); 
int unregister console(struct console *); 


1t VJ E init/main.c 文件 中 的 start kernel0 函 数 中 ,会 调用 console_init0 函 数 ， 该 函数 会 调用 位 于 
内 核 存 放 console 初始 化 函数 的 代码 段 , 调用 其 中 的 每 一 个 初始 化 console 的 函数 , 如 代码 清单 14.21。 


代码 清单 14.21 console_init() 函 数 


















































































































































1 void | init console init (void) 
2 

3 esl ee veale 

4 

5 tty ldisc begin(); 

6 

T call = Con To start; 
8 while deall - eon inteall endy i 
9 (EL 

KO call«te; 

TET, ) 

12) 






































实际 上 ， 对 于 任何 一 个 初始 化 console 的 函数 而 言 ， 只 需要 通过 console initcall()EfT 81 , 
即 可 把 它 放 入 .con_initcallinit 节 〈 开 始 地 址 为 、_ con_initcall_start)， 典 型 地 ， 如 最 常用 的 8250 对 
应 的 console 结构 体 以 及 初始 化 代码 如 清单 14.22. 


代码 清单 14.22 8250 的 console 及 console initcall 


1 static struct console serial8250 console - ( 
2 .name e MIENNE 
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实际 上 ，console_initcall0 是 一 个 宏 ， 其 定义 于 include/linux/init.h 文件 
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.write = serial8250 console write, 
.device = uart console device, 

.setup = serial8250 console setup, 

.early setup = serial8250 console early setup, 
.flags = CON PRINTBUFFER, 

.index El 

.data = &serial8250 reg, 


; 


static int . init serial8250 console init (void) 
{ 
if (nr uarts » UART NR) 
nr uarts = UART NR; 


serial8250 isa init ports(); 
register console(&serial8250 console); 
return 0; 

} 

console initcall(serial8250 console init); 











f 








它 可 以 展开 成 : 





#define console initcall(fn) \ 





St cut nt eon me a 
ENUScOEENESCcCH onec 二 有 于 机 


ni 











留意 其 中 的 _ section(.con_initcallLiniD， 实 际 上 是 一 个 链接 阶段 的 指示 ， 表 明 将 指定 的 函数 放 
入 .con_initcall.init 节 。 

console_init0 是 由 init/main.c 文件 中 的 start. kernel PE ZU] FI], MÆ console init 0 被 
执行 了 一 系列 的 操作 。 为 了 在 console initO 被 调 








AL 


前 ， 还 
前 就 能 使 用 printkO0， 可 以 使 用 内 核 的 “early printk” 
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支持 ， 该 选项 位 于 内 核 配置 菜单 “Linux Kernel Configuration" FHJ * Kernel hacking" KAZ T- 
对 于 early printk 的 console 的 注册 往往 通过 解析 内 核 的 early param 完成 ， 如 对 于 8250 而 言 ， 


定义 了 


























“earlycon” 这 样 一 个 内 核 参 数 ， 当 解析 此 内 核 参数 时 ， 相 应 地 被 early param. 0 〇 绑 定 的 函 



































数 setup_early_serial8250_consoleO 被 调用 ， 此 函数 将 注册 一 个 用 于 early printk 的 console. 


KO OB TO UT aS CO BO- pes 





jer «4 OU SELON OPNS OX INS ger c 


No NO 


代码 清单 14.23 8250 的 early printk console 


Static struct console early serial8250 console  initdata - ( 





.name LIEU t 

.Write = early serial8250 write, 
.flags = CON PRINTBUFFER | CON BOOT, 
.index = -1, 


; 


int | init setup early serial8250 console(char *cmdline) 
( 

char *options; 

Dm cm 


options - strstr(cmdline, "uart8250,"); 
aig. Op tions) 
options - strstr(cmdline, "uart,"); 
if (loptions) 
return 0; 


} 


options Mtr (none 
err = early serial8250 setup (options); 





INUX 





oo 


327 





328 


Linux 设备 驱动 开发 详解 (第 2 版 ) 


22 abr (esee x 
29 return err; 


25 register console(&early serial8250 console); 


2 return 0; 
28 


30 early param("earlycon", setup early serial8250 console); 




















例如 ,在 Linux 启动 的 command line ! 


earlycon-uart8250,mmio,0xff5e0000, 
earlycon-uart8250,io,0x3f8,9600n8 


























出 了 一 个 CON_BOOT 属性 。 实 例 上 ， 所 有 的 




















initcall 阶段 的 时 候 被 注销 ， 注 销 它们 的 函数 是 diable boot_consoles0， 其 定义 如 代码 清单 14.24。 














留意 一 下 ， 代 码 清单 14.22 第 7 行 的 flags 




















设置 如 下 参数 ,将 使 能 8250 作为 early printk 的 console. 








和 代码 清和 
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5200n8 





É 14.23 第 4 行 的 flags 的 区 别 ， | 
有 CON_BOOT 属性 的 console 都 会 在 内 核 初始 化 至 late 


























会 发 现 后 者 多 














代码 清单 14.24 disable_boot_consoles() 函 数 


1 static int mit disable boot consoles (void) 

2E 

3 if (console drivers !- NULL) { 

4 if (console drivers-»flags & CON BOOT) ( 

5 printk(KERN INFO "turn off boot console $s$dWn", 
6 console drivers-»name, console drivers-^index); 
T return unregister_console (console_drivers); 

8 } 

g } 

10 return 0; 

FIBI 


12 late initcall (disable boot consoles); 
这 里 再 补充 一 个 知识 , 内 核 的 initcall 分 成 了 8 级 , 对 应 的 节 分 别 为 .initcall0.init、 .initcalll.init、 


.initcall2.init、.initcall3.init、.initcall4.init、.initcall$.init、.initcall6.init、.initcall7.init， 分 别 通过 pure - 






























































initcallfn). core initcall(fn) ~ postcore initcall(fn) ~ arch initcall(fn). subsys initcall(fn). fs initcall(fn). 





device initcall(fn). late initcall(fn) n] 4 8 xE HJ 





定 的 initcall 不 依赖 于 任何 其 他 部 分 ， 因 此 






































, 


指定 函数 只 能 built-in， 不 能 在 模块 ! 




















«X3 


函数 放 入 对 应 的 节 。 对 于 pure_initcall0) 而 言 ， 它 指 





F1-—7 


级 而 言 , 还 存在 对 应 的 sync 版 本 , 分 别 通过 core_initcall sync(fn). postcore initcall sync(fn). arch - 





initcall sync(fn). subsys initcall sync(fn). fs initcall sync(fn). device initcall sync(fn). late - 





initcall sync(fn) 修 饰 。 



































被 放 入 了 .initcall7.init 这 个 节 。 





通过 代码 清单 14.24 的 第 12 行 可 以 看 





14.8.1 S3C6410 串口 硬件 描述 
S3C6410 具有 4 路 高 速 串口 , LDD6410 为 第 1 路 是 
















































































插座 引出 ， 其 原理 如 图 14. 所 示 ， 图 











um 























设计 了 1 个 DB9 接口 ,其 





的 SP3232EEA 是 1 个 电 平 转换 芯片 。 





1 4.8 实例 : S3C6410 串口 与 console 驱动 


他 都 
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H, disable boot consoles()9E late_initcall0 修 饰 ， 因 此 
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LDD6410 开发 板 所 用 内 核 版 本 2.6.28.6 的 串口 驱动 位 于 drivers/serial/samsung.c. drivers/ 
serial/s3c6400.c 文件 ， 其 中 samsung.c 是 底层 核心 , 而 s3c6400.c (为 S3C6400. S3C6410. CPU S5P644 
服务 ) 调用 了 它 。 


14.8.2 S3C6410 $A UART 驱动 


在 samsung.c MIRRI RRA ERKO, JI uart register driver(). uart unregister driver) 
册 和 注销 了 s3c24xx uart drv， 如 代码 清单 14.25. 


代码 清单 14.25. S306410 串口 驱动 核心 模块 加 载 与 卸载 函数 

















































































































1 static struct uart driver s3c24xx uart drv - ( 
2 .owner — THIS MODULE, 
3 .dev name = "S3c2410 serial", 
4 IIS = 3, 
5 EC On = S3C24XX SERIAL CONSOLE, 
6 .driver name = S3C24XX SERIAL NAME, 
9 .major = S3C24XX SERIAL MAJOR, 
8 .minor = S3C24XX SERIAL MINOR, 
$2 Jg 
0 
T ostatic int -IOLE S.S C234 0250 Serral modinit (vord) 
PEE 
3 int ret; 
4 
5 ret = uart register driver(&s3c24xx uart drv); 
DS E Per occu 
Ji printk(KERN ERR "failed to register UART driverNin"); 
8 icr, cbe 
5 
20 
21 return 0; 
22 
2 
24 static void | exit s3c24xx serial modexit (void) 
2/5 
26 uart unregister driver(&s3c24xx uart drv); 
23 
28 
29 module init(s3c24xx serial modinit); 


30 module exit(s3c24xx serial modexit); 
s3c6400.c 是 一 个 platform 驱动 ， 在 其 probe0 成 员 函 数 s3c6400 serial probe() 中 ， 会 调用 
samsung.c 中 的 s3c24xx serial probeO0， 而 该 函数 会 添加 uart_port: 


int s3c24xx serial probe(struct platform device *dev, 



































sSLruet sdjc24xX uart into "info) 


uart add one port(&s3c24xx uart drv, &ourport-»port); 


} 
相反 的 ， 在 s3c6400.c 这 一 platform 驱动 的 remove0 成 员 函 数 s3c24xx_serial remove), & 


调用 uart_remove_one_port() 去 除 uart_port。 
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注意 被 添加 的 uart_port 的 uart ops 成 员 定 义 在 samsung.c 文件 中 ， 如 代码 清单 12.26。 














代码 清单 12.26 S3C6410 串口 驱动 的 uart_ops 











1 static struct uart ops s3c24xx serial ops - ( 
2- je = s3c24xx serial pm, 

3 .tx empty = s3c24xx serial tx empty, 

4 .get mctrl = s3c24xx serial get mctrl, 

S  gEXSE eL = s3c24xx serial set mctrl, 

(9. :SCOPEEX = s3c24xx serial stop tx, 

Jue Star eate CM Saco Serta lE SEIE COE, 

ONE SOIN —- s3c24xx serial stop rx, 

9 .enable ms = sS3c24xx serial enable ms, 
0 .break ctl = s3c24xx serial break ctl, 
1l .startup = s3c24xx serial startup, 

2 .shutdown = s3c24xx serial shutdown, 

3 .set termios = s3c24xx serial set termios, 
4 .type = s3c24xx serial type, 

5 .release port = s3c24xx serial release port, 
6 .request port - s3c24xx serial request port, 
d! s(eXohsu ite 1exowete —- s3c24xx serial config port, 
Se = s3c24xx serial verify port, 
9 #if defined(CONFIG S5P UART DMA EN) 

20 .flush buffer  - s3c24xx flush buffer, 

21 #endif 

22 E 


14.8.3 S3C6410 $A console 驱动 


在 使 能 内 核 配 置 选项 CONFIG. SERIAL SAMSUNG CONSOLE 的 情况 下 ，S3C6410 8 
动 的 console 部 分 会 被 包含 ， 它 位 于 drivers/serial/samsung.c， 如 代码 清单 16.27 所 示 。 























Jk 


pun 






































代码 清单 16.27 S3C6410 串口 console 驱动 


1 static struct console s3c24xx serial console - ( 

2 .name = S3C24XX SERIAL NAME, 

i .device = uart console device, 

4 "Ed gs — CON PRINTBUFFER, 

5 .index = -1, 

6 .write = s3c24xx serial console write, 

ji .setup = s3c24xx serial console setup 

Gg Jg 

9 

10 int s3c24xx serial initconsole(struct platform driver *drv, 
La etme E302 ls mart EA FATO) 
112 

13r (d 

14 struct platform device *dev - s3c24xx uart devs[0]; 
15 

24 

2/5 if (strcmp (dev->name, drv-»driver.name) !- 0) 

26 return 0; 

2 

28 sS3c24xx serial console.data - &s3c24xx uart drv, 

209 Seea Seria DEED Oris) 
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30 

2il register console(&s3c24xx serial console); 
32 return 0; 

3S 


p 


而 在 drivers/serial/samsung.h 文件 中 ， 通 过 如 下 方法 将 s3c24xx_serial initconsole 放 入 
了 .con_initcall.init 代码 段 。 这 样 console_init() 即 会 调用 该 函数 。 


14.9 FE 


TTY 设备 驱动 的 主体 工作 围绕 tty driver 这 个 结构 体 的 成 员 函 数 展开 ， 主 要 应 实现 其 中 的 数 
据 发 送 和 接收 流程 以 及 tty 设备 线路 设置 接口 函数 。 

针对 串口 ， 内 核实 现 了 串口 核心 层 ， 这 个 层 实 现 了 号 
备 驱 动 的 主体 工作 从 tty_driver 转移 到 了 uart driver. 
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口 设备 通用 的 tty_driver。 因 此 ， 串 口 设 
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PC 总 线 仅仅 使 用 SCL、SDA 这 两 根 信号 线 就 实现 了 设备 之 间 的 数据 
交互 ， 极 大 地 简化 了 对 硬件 资源 和 PCB 板 布线 空间 的 占用 。 因 此 ，FC 总 
线 被 非常 广泛 地 应 用 在 EEPROM、 实 时 钟 、 小 型 LCD 等 设备 与 CPU 的 
接口 中 。 

Linux 系统 定义 了 PC 驱动 体系 结构 ， 在 Linux RAP, PC 驱动 由 3 
部 分 组 成 ， 即 PC Heb. PC 总 线 驱 动 和 TC 设备 驱动 。 这 3 部 分 相互 协 
作 ， 形 成 了 非常 通用 、 可 适应 性 很 强 的 PC 框架 。 

6.1 节 对 Linux C 体系 结构 进行 分 析 , 讲解 3 个 组 成 部 分 各 自 的 功能 
及 相互 联系 。 

6.2 节 对 Linux PC 核心 进行 分 析 ， 讲 解 2c-core.c 文件 的 功能 和 主要 
函数 的 实现 。 

6.3 节 、6.4 节 分 别 详 细 介绍 PC 总 线 驱 动 和 PC 设备 驱动 的 编写 方法 ， 
给 出 可 供 参 考 的 设计 模板 。 
6.5 节 、6.6 节 以 6.3 节 和 6.4 节 给 出 的 设计 模板 为 基础 ， 讲 解 S3C6410 














































































































































































































ARM 处 理 器 PC 总 线 驱 动 以 及 挂 接 在 PC 总 线 上 的 AT24XX 系列 
EEPROM 驱动 。 
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Linux 的 I2C 体系 结 


Linux 的 PC 体系 结构 分 为 3 个 组 成 部 分 。 


(D PC 核心 。 














TC 核心 提供 了 PC 总 线 驱 动 和 设备 驱动 的 注册 、 注 销 方法 
FER. 5 


























CD PC 总 线 驱动 。 


PC 总 线 驱动 是 对 PC 8f 
接 集成 在 CPU 内 部 。 

PC 总 线 驱动 主要 包含 了 IC 适配器 数据 结构 i2c adapter. IC 适 再 
i2c algorithm 和 控制 PC 适配器 产 4 
经 由 EC 总 线 驱动 的 代码 ， 我 们 可 以 控制 PC 适配器 以 主 控 方 式 产生 j 
周期 ， 以 及 以 从 设备 方式 被 读 写 、 产 4 

















G) PC 设备 驱动 。 





PC 设备 驱动 〈 也 称 为 客户 纪 
CPU 控制 的 PC 适配器 上 ， 通 过 
PC 设备 驱动 主要 包含 了 数 























用 户 空间 



































应 用 程序 

















PC 设备 驱动 (Cem i2c dev 
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algori 






























































与 特定 适配器 硬件 
内 核 空间 相关 的 代码 
硬件 
IC 适配器 
| | 
PC 设备 PC 设备 
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15.1 Linux C 体系 结构 





















































在 Linux 2.6 内 核 ! 








， 所 在 














FE 通 信 信 号 的 函数 。 








, FC 通信 方 光 
L 体 适配器 无 关 的 代码 以 及 探测 设备 、 检 测 设 备 地 址 的 J」 














适配器 端的 实现 ， 适 配器 可 | 





上 层 代 码 等 。 




















CPU 控制 ， 
































区 动 》 是 对 PC 硬件 体系 结构 1! 
PC 适配器 与 CPU 交换 数据 。 
民 结 构 i2c_driver ^ 


E ACK 等 。 









































了 的 PC 设备 都 在 sysfs 文件 系统 中 显示 





， 存 于 /sys/bus/i2c/ 目 





已 器 的 algorithm Z3 




















Il i2c client, 我 们 需要 根据 具体 设备 实现 








录 ， 


- CB] "algorithm ”) 


t 至 可 以 直 


居 结 构 





开始 位 、 停 止 位 、 读 写 





设备 端的 实现 ， 设 备 一 般 挂 接 在 受 


中 的 


以 
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适配器 地 址 和 芯片 地 址 的 形式 列 出 ， 例 如 ; 














$ tree /sys/bus/i2c/ 

/Sys/bus/i2c/ 

-- devices 
-- 0-0048 -» ../../../devices/legacy/i2c-0/0-0048 
-- 0-0049 -» ../../../devices/legacy/i2c-0/0-0049 
-- 0-004a -» ../../../devices/legacy/i2c-0/0-004a 
-- 0-004b -» ../../../devices/legacy/i2c-0/0-004b 
-- 0-004c -» ../../../devices/legacy/i2c-0/0-004c 
-- 0-004d -» ../../../devices/legacy/i2c-0/0-004d 
-- 0-004e -> ../../../devices/legacy/i2c-0/0-004e 
oo OOO ft^ ldgewlces/!legacy?i2c-0/0-002f 

Vc vol eee 
ll 








IL ea 
-- 0-0048 -> ../../../../devices/legacy/i2c-0/0-0048 
-- 0-0049 -» ../../../../devices/legacy/i2c-0/0-0049 
-- 0-004a -» ../../../../devices/legacy/i2c-0/0-004a 
-- 0-004b -» ../../../../devices/legacy/i2c-0/0-004b 
-- 0-004c -» ../../../../devices/legacy/i2c-0/0-004c 
-- 0-004d -» ../../../../devices/legacy/i2c-0/0-004d 
-- 0-004e -» ../../../../devices/legacy/i2c-0/0-004e 
Jj 0-004f -> ../../../../devices/legacy/i2c-0/0-004f 























在 Linux 内 核 源 代码 的 drivers 目录 下 包含 一 个 i2c 目录， 而 在 i2c 目录 下 又 包含 如 下 文件 
和 文件 夹 。 

(12 i2c-core.c。 

这 个 文件 实现 了 PC 核心 的 功能 以 及 /proc/bus/i2c* 接 

(2) i2c-dev.c. 

实现 了 PC 适配器 设备 文件 的 功能 ， 每 一 个 PC 适配器 都 被 分 配 一 个 设备 。 通 过 适配器 访问 
设备 时 的 主 设备 号 都 为 89， 次 设备 号 为 0 0 一 255。 应 用 程序 通过 “i2c-%d”(i2c-0, i2c-1,…, i2c-10,…) 
文件 名 并 使 用 文件 操作 接口 open()、write()、read()、ioctl0 和 close0 等 来 访问 这 个 设备 。 
i2c-dev.c 并 没有 针对 特定 的 设备 而 设计 ， 只 是 提供 了 通用 的 read0、write0 和 ioctlO 等 接口 ， 
应 用 层 可 以 借用 这 些 接口 访问 挂 接 在 适配器 上 的 PC 设备 的 存储 空间 或 寄存 器 ， 并 控制 PC 设备 
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的 工作 方式 。 
(3) chips 文件 夹 。 
这 个 目录 中 包含 了 一 些 特定 的 了 C 设备 驱动 ， 如 Dallas 公司 的 DS1337 实时 钟 芯片 、EPSON 














公司 的 RTC8564 SIRE epos Hr 4 PC 接口 的 EEPROM 驱动 等 。 
在 具体 的 PC 设备 驱动 中 ,调用 的 都 是 了 C 核心 提供 的 API， 因 此 ， 这 使 得 具体 的 PC 设备 驱 
动 不 依 赖 于 CPU 的 类 型 和 PC 适配器 的 硬件 特性 。 

(4) busses 文件 夹 。 

这 个 文件 中 包含 了 一 些 FC 总 线 的 驱动 ， 如 针对 S3C2410、S3C2440 和 S3C6410 等 处 理 器 的 
EC 控制 器 驱动 为 i2c-s3c2410.c。 

(5) algos 文件 夹 。 

实现 了 一 些 PC 总 线 适配器 的 algorithm. 
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此 尹 


， 内 核 中 的 i2c.h 这 个 头 文件 对 i2c_driver、i2c_client、i2c_adapter 和 i2c algorithm 这 4 


















































个 数据 结构 进行 了 定义 。 理 解 这 4 个 结构 体 的 作用 十 分 关键 ， 代 码 清单 15.1. 15.2. 15.3. 15.4 
分 别 给 出 了 它们 的 定义 。 


DSS 




















代码 清单 15.1  i2c adapter 结构 体 


struct i2c adapter 有 





struct module *owner; /# 所 属 模块 */ 

unsigned int id;  /*algorithm Hj26724, 5E XT i2c-id.h, DÀ I2C ALGO Jf38*/ 
unsigned int class; 

struct i2c algorithm *algo;/* 总 线 通 信 方 法 结构 体 指针 */ 

void *algo data;/* algorithm 数据 */ 

int (*client register) (struct i2c client *); /*client 注册 时 调用 */ 

int (*client unregister) (struct i2c client *); /*client 注销 时 调用 */ 





















































u8 level; 
struct semaphore bus lock; /* 控 制 并 发 访问 的 自 旋 锁 */ 
struct semaphore clist lock; 








int timeout; 

int retries; /* 重 试 次 数 */ 

struct device dev;/* 适配器 设备 */ 

struct class_device class_dev;/* 类 设备 */ 

Sb ES 

struct list head clien; /* client &EX3L*/ 
Struct list-head Ist; 

char name[48]; /* 适 配器 名 称 */ 

struct completion dev released; /* 用 于 同步 */ 

















代码 清单 15.2 i2c algorithm 结构 体 


Struct abe ruleresenticlawn. qd 


int (*master xfer) (struct i2c adapter *adap,struct i2c msg *msgs, 
int num); /*i2c 传输 函数 指针 */ 

int (*smbus xfer) (struct i2c adapter *adap, ul6 addr,  /*smbus 传输 函数 指针 */ 
unsigned short flags, char read write, 
u8 command, int size, union i2c smbus data * data); 

u32 (*functionality) (struct i2c adapter *);/* 返 回 适 配器 支持 的 功能 */ 








上 述 代码 第 4 行 对 应 为 SMBus 传输 函数 指针 ，SMBus 大 部 分 基于 PC 总 线 规范 ，SMBus 
不 需 增加 额外 引 脚 。 与 PC 总 线 相 比 ，SMBnus 增加 了 一 些 新 的 功能 特性 ， 在 访问 时 序 也 有 一 定 




















代码 清单 15.3 i2c driver 结构 体 


SErUCGE a2 erebasbeus- d 


DICT 

unsigned int class; 

int (*attach adapter) (struct i2c adapter *); /*ÍKIH i2c adapter 函数 指针 */ 
int (*detach adapter) (struct i2c adapter *); /* 脱 离 i2c adapter 函数 指针 */ 
int (*detach client) (struct i2c client *); /*i2c client 脱离 函数 指针 */ 
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7 Ime G Oe (St etn 7. celere. Str Uce ut 

8 int (*tremove)i(struct i20 elient <); 

9 yore (*shutdowny (struct 20 Client *y- 

0 int (*suspend) (struct i2c client *, pm message t mesg); 

Jl dee. sume (une dee ede 人 

2 int (*command) (struct i2c client *client, unsigned int cmd, void *arg); 
S. SErucEe oe er driver Arive; 

4 const struct i2c device id *id table; /* 该 驱动 所 支持 的 设备 ID 表 */ 

No ing o p*detectiistruck izo Oem <7 Dne klinch struet 426 opare info =e 
& Const struct i2c client address data *address data; 

g; struct list_head clients; 

8); 





代码 清单 15.4 i2c client 结构 体 
LL Btruct oot en 
2 unsigned int flags;/* mE */ 
3 unsigned short addr;  /* {R 7 Ap HH */ 
4 char name[I2C NAME SIZE]; /* 设备 名 称 */ 
5 struct i2c adapter *adapter;/* 依 附 的 i2c_adapter*/ 
6 struct i2c driver *driver;  /* 依 附 的 i2c_driver */ 
7 struct device dev;  /* 设备 结构 体 */ 
8 int irq; /* 设备 使 用 的 中 断 号 */ 






































9 struct list head list; E 
10 struct completion released;  /* 用 于 同步 */ 
ld 4g 






































下 面 分 析 i2c driver. i2c client, i2c adapter 和 i2c algorithm 这 4 个 数据 结构 的 作用 及 
音节 的 关系 。 

(1) i2c adapter 5 i2c algorithm. 

i2c adapter 对 应 于 物理 上 的 一 个 适配器 ， 而 i2c algorithm 对 应 一 套 通信 方法 。 一 个 PC 适 配 
器 需要 i2c_algorithm 中 提供 的 通信 函数 来 控制 适配器 上 产生 特定 的 访问 周期 。 缺 少 i2c algorithm 
的 i2c adapter 什么 也 做 不 了 ， 因 此 i2c_adapter 中 包含 其 使 用 的 i2c_algorithm 的 指针 。 

i2c_algorithm 中 的 关键 函数 master. xfer0 用 于 产生 PC 访问 周期 需要 的 信号 ， 以 i2c_msg〔 即 
IC 消息 ) 为 单位 。i2c_msg 结构 体 也 非常 关键 ， 代 码 清单 15.5 给 出 了 它 的 定义 。 


I 
BR 
> 
uu 






































































































































HT 





















































代码 清单 15.5 i2c msg 结构 体 








ES CT 

2 

3  ..u16 flags;/* Ww& */ 

4 -.ul6 len;/* i$ S H*/ 

5  ..u8 *buf;/* 消息 数据 *7 

6 ); 

(2) i2c driver 5 i2c client. 

i2c driver 对 应 一 套 驱 动 方 法 ， 其 主要 成 员 函 数 是 probe()、remove()、suspend()、resume() 等 ， 
































另外 id_table 是 该 驱动 所 支持 的 PC 设备 的 ID 表 。i2c_client 对 应 于 真实 的 物理 设备 ， 每 个 PC 设 
备 都 需要 一 个 i2c_client 来 描述 。i2c_driver 与 i2c client 的 关系 是 一 对 多 ， 一 个 i2c_driver 上 可 以 
支持 多 个 同等 类 型 的 i2c_client。 
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i2c client 信息 通常 在 BSP 的 板 文件 中 通过 i2c_board info 填充 ， 如 下 面 代码 就 定义 了 一 个 了 
PC 设备 ID 为 “ad7142 joystick” 地 址 为 0x2C、 中 断 号 位 IRQ_PF5 的 i2c_client: 
Statr structei2cebodardebimto ww bnitdadtdecxxed2csbodrdebsmtople--t 
#if defined(CONFIG JOYSTICK AD7142) || defined(CONFIG JOYSTICK AD7142 MODULE) 
1 


























I2C BOARD INFO("ad7142 joystick", O0x2C), 
.irq = IRQ PF5, 
ho 




















] 

在 PC 总 线 驱动 i2c bus type 的 match() Pt i2c_device_match() 中 ， 会 调用 i2e match. id()PR 
数 匹 配 板 文件 中 定义 的 ID 和 i2e. driver 所 支持 的 ID K. 

(3) i2c adpater 与 i2c_client。 

i2c adpater 5j i2c client 的 关系 与 PC 硬件 体系 中 适配器 和 设备 的 关系 一 致 ， 即 i2c client 依 
附 于 i2c_adpater。 由 于 一 个 适配器 上 可 以 连接 多 个 PC 设备 ， 所 以 一 个 i2c_adpater 也 可 以 被 多 个 
i2c client 依附 ，i2c_adpater 中 包括 依附 于 它 的 i2c_client 的 链表 。 

假设 EC 总 线 适配器 xxx 上 有 两 个 使 用 相同 驱动 程序 的 yyy PC 设备 , 在 打开 该 PC 总 线 的 设 
备 结 点 后 相关 数据 结构 之 间 的 逻辑 组 织 关 系 将 如 图 15.2 所 示 。 

从 上 面 的 分 析 可 知 ， 虽 然 PC 硬件 体系 结构 比较 简单 ， 但 是 FC 体系 结构 在 Linux 中 的 实现 
却 相 当 复 杂 。 当 工程 师 拿 到 实际 的 电路 板 , 面 对 复 杂 的 Linux PC 子 系统 ,应 该 如 何 下 手写 驱动 呢 ? 
究竟 有 哪些 是 需要 亲自 做 的 ， 哪 些 是 内 核 已 经 提供 的 呢 ? 理 清 这 个 问题 非常 有 意义 ， 可 以 使 我 们 
轩 对 具体 问题 时 迅速 地 抓 住 重点 。 

一 方面 ， 适 配器 驱动 可 能 是 Linux 内 核 本 身 还 不 包含 的 ， 男 一 方面 ， 挂 接 在 适配器 上 的 具体 
设备 驱动 可 能 也 是 Linux 内 核 还 不 包含 的 。 因 此 ， 工 程 师 要 实现 的 主要 工作 如 下 。 

e ”提供 TC 适配器 的 硬件 驱动 ， 探 测 、 初 始 化 IC 适配器 (如 申请 TC 的 IO 地 址 和 中 断 号 入 
驱动 CPU 控制 的 TC 适配器 从 硬件 上 产生 各 种 信号 以 及 处 理 PC 中 断 等 。 

e 提供 PC 适配器 的 algorithm， 用 有 具体 适配器 的 xxx_xfer0 函 数 填充 i2c_algorithm 的 
master xfer 指针 ， 并 把 i2c_algorithm 指针 赋值 给 i2c_adapter 的 algo 指针 。 

e 实现 IC 设备 驱动 中 的 i2c_driver 接口 ， 用 具体 设备 yyy 的 yyy_probe0、yyy_remove0、 
yyy_suspend()、yyy_resume() 函 数 指针 和 i2c_device id 设备 ID 表 赋 值 给 i2c driver 的 
probe. remove. suspend. resume 和 id_table 指针 。 

e 实现 IC 设备 所 对 应 类 型 的 具体 驱动 ，i2c_driver 只 是 实现 设备 与 总 线 的 挂 接 ， 而 挂 接 在 
总 线 上 的 设备 则 是 千差万别 。 例 如 ， 如 果 是 字符 设备 ， 就 实现 文件 操作 接口 ， 即 实现 具 
体 设 备 yyy 的 yyy_read0、yyy_write0 和 yyy_ioctl0 函 数 等 ， 如 果 是 声卡 ， 就 实现 ALSA 

驱动。 
上述 工作 中 前 两 个 属于 PC 总 线 驱 动 ， 后 两 个 属于 TC 设备 驱动 ， 做 完 这 些 工作 ， 系 统 会 增 
加 两 个 内 核 模块 。15.3 一 15.4 节 将 详细 分 析 这 些 工作 的 实施 方法 ， 给 出 设计 模板 ， 而 15.5 一 15.6 
节 将 给 出 两 个 具体 的 实例 。 
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i2c. client 
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£g 
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i2cdev. fops 
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i2cdev. read 
i2cdev. write 
i2cdev. ioctl 
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lock 
wait 
msg 
msg num 
msg. idx 
msg ptr 


name 


algo. data 
algo 
inc. use 
dec. use 
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client register 
client unregister 


data 
lock 
flags 


clients 


timeout 
retries 


client count 


i2c. driver 


name 


flags 

probe 
remove 
id table 


IC 驱动 的 各 数据 结构 的 关系 


2 Linux 12C 核心 























PC 核心 (drivers/i2c/i2c-core.c) ! 


提供 了 一 组 不 依赖 于 
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fi 
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不 需要 被 工程 师 修改 ， 但 是 理解 其 中 的 主要 函数 非常 关键 ， 因 为 C 总 线 驱 动 和 设备 驱动 之 间 依 
HT PC 核心 作为 纽带 。PC 核心 中 的 主要 函数 如 下 。 
CD 增加 /删除 i2c adapter. 


int i2c add adapter(struct i2c adapter *adap); 






























































int i2c del adapter(struct i2c adapter *adap); 
(20 增加 7 


int i2c register driver(struct module *owner, struct i2c driver *driver); 
































IRR i2c driver. 





int i2c del driver(struct i2c driver *driver); 
inline int i2c add driver(struct i2c driver *driver); 


(3) i2c client 依附 /脱离 。 


Tae sie arrechi ee enue Me elient “Olien p 























int i2c detach client(struct i2c client *client); 
当 一 个 具体 的 client 被 侦 测 到 并 被 关联 的 时 候 , 设备 和 sysfs 文件 将 被 注册 。 相 反 地 , 在 client 
被 取消 关联 的 时 候 ，sysfs 文件 和 设备 也 被 注销 ， 如 代码 清单 15.6 所 示 。 


代码 清单 15.6 1C 核心 的 client attach/detach 函数 


ET 
{ 
























































device register(&client-»dev); 


int i2c detach client(struct i2c client *client) 


11 device unregister(&client-»dev); 


DIM 
(4) PC 传输 、 发 送 和 接收 。 


int i2c transfer(struct i2c adapter * adap, struct i2c msg *msgs, int num); 
int i2c master send(struct i2c client *client,const char *buf ,int count); 
ne cxmalsibedseme eS Loe oe ee cient C d CSI TENES GNE C OU TEE) PT 


i2c transfer EE UH F Ef; PC 适配器 和 PC 设备 之 间 的 一 组 消息 交互 ，i2c_master_send0 函 数 
和 i2c master recv0 函 数 内 部 会 调用 ic_transfer0 函 数 分 别 完成 一 条 写 消 息 和 一 条 读 消 息 ， 如 代码 
清单 15.7、 代 码 清单 15.8 所 示 。 































































































代码 清单 15.7 IC 核心 的 i2c_master_send 函数 


1 ant lzocmasber C5endistruct 426 client *client.consb char "buf int count) 
ZEE 

3 int ret; 

4 struct i2c adapter *adap=client->adapter; 
5 struct i2c msg msg; 

e 7e ER 

z msg.addr = client->addr; 

8 msg.flags = client-»flags & I2C M TEN; 

9 msg.len - count; 

10 msg.buf - (char *)buf; 

11 — /* 传 输 消 息 */ 





340 INUX 





Linux 的 12C 核心 、 总 线 与 设备 驱动 


00G 


ret = i2c transfer(adap, &msg, 1); 


rern (ret == 1) ? count : ret; 


代码 清单 15.8 lC 核心 的 i2c_master_recv 函数 


1 
2 
3 struct i2c adapter *adap-client-»adapter; 





4 eho le a Were MSI 

i OE 

/* 构 造 一 个 读 消 息 */ 

msg.addr - client-»addr; 

msg.flags = client-»flags & I2C M TEN; 
msg.flags |- I2C M RD; 

msg.len = count; 


O O OY Ol 


msg.buf = buf; 
/* 传 输 消 息 */ 
ret — i2c transfer(adap, &msg, 1); 





(Oy sim. 3) S [M 6») 


/* 成 功 (1 条 消息 被 处 理 ) , 返回 读 的 字 节 数 */ 


6 rern (ret -- 1) ? count : ret; 






























































i2c transfer() PK Zi Z& Er AH. d Up a x Bo ds 17 FE B fF S6 p IH I ^6 HU 86 7J. E Hore S SI 
i2c adapter 对 应 的 i2c algorithm, Jf-fi Hj i2c algorithm 的 master_xfer0 函 数 真正 驱动 硬件 流程 ， 
如 代码 清单 15.9 所 示 。 































































































ues 2 EOS ; m 
代码 清单 15.9 1C 核心 的 i2c_transfer 函数 
人 

2o 
3) inte ret; 





5 if (adap-»algo-»master xfer) ( 

6 

7 ret = adap-»algo-»master xfer(adap,msgs,num); /* 消息 传输 */ 

8 

9 return ret; 

10 } eise ( 

AL 1L dev dbg(&adap-»dev, "I2C level transfers not supportedWin"); 
3:2 return -ENOSYS; 

iS 

14 } 





5.3 Linux I2C 总 线 驱 动 


15.3.1 2C 适配器 驱动 加 载 与 卸载 
PC 总 线 驱 动 模块 的 加 载 函数 要 完成 两 个 工作 。 
e 初始 化 PC 适配器 所 使 用 的 硬件 资源 ， 如 申请 IO 地 址 、 中 断 号 等 。 
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e 通过 i2c add adapter0 添 加 i2c adapter 的 数据 结构 ， 当 然 这 个 i2c_adapter 数据 结构 的 成 
员 已 经 被 xxx 适配器 的 相应 函数 指针 所 初始 化 。 

PC 总 线 驱 动 模块 的 卸载 函数 要 完成 的 工作 与 加 载 函数 相反 。 

e 释放 TC 适配器 所 使 用 的 硬件 资源 ， 如 释放 IO 地 址 、 中 断 号 等 。 

e 通过 i2c del adapter() 删 除 i2c_adapter 的 数据 结构 。 

代码 清单 15.10 所 示 为 PC 适配器 驱动 的 模块 加 载 和 外 载 函数 的 模板 。 


代码 清单 15.10 IC 总 线 驱动 的 模块 加 载 和 外 载 函数 模板 


Skoltele tn Ea (ly) 


{ 







































































xxx adpater hw init(); 
i2c.add .adapter(&xxx adapter); 


Static void |. exit i2c adapter xxx exit (void) 
( 


1 

2 

3 

4 

m o3 
6 

y 

8 

9 xxx adpater hw free(); 
T 


0 i2c del adapter(&xxx adapter); 
dldb p 


上 述 代码 中 xxx. adpater hw. init()l xxx_adpater_hw_free(0) 函 数 的 实现 都 与 具体 的 CPU 和 PC 
适配器 硬件 直接 相关 。 


15.3.2 PC 总 线 通信 方法 


我 们 需要 为 特定 的 PC 适配器 实现 其 通信 方法 ， 主 要 实现 i2c_algorithm 的 master. xfer E 2t 
和 functionalityO 函 数 。 

fonctionalityO 函 数 非常 简单 ， 用 于 返回 algorithm 所 支持 的 通信 协议 ， 如 DC FUNC DC. DC - 
FUNC 10BIT ADDR, I2C FUNC SMBUS READ BYTE、 I2C FUNC SMBUS WRITE BYTE 等 。 

master_xfer() 函 数 在 PC 适配器 上 完成 传递 给 它 的 i2c_msg 数组 中 的 每 个 PC 消息 ， 代 码 清单 
15.11 所 示 为 xxx 设备 的 master_xfer() 函 数 模板 。 


代码 清单 15.11. ^C 总 线 驱 动 master. xfer 函数 模板 











































































































































































































static int i2c adapter xxx xfer(struct i2c adapter *adap, struct i2c msg "*msgs, 
int num) 


{ 





i2c adapter xxx start(); /* 产 生 开始 位 */ 
/* 是 读 消息 */ 


Ji 

2 

3 

4 e 

3 tor (aL lg me abu) di 
6 

y 

8 (mS oy lM 


9 i2c adapter xxx setaddr((msg-»addr << 1) | 1); /* 发 送 从 设备 读 地 址 */ 

10 i2c adapter xxx wait ack(); /* 获 得 从 设备 的 ack*/ 

ibit i2c adapter xxx readbytes (msgs[i]-»buf, msgs[i]-»1en); /* 读 取 msgs[i] ->len 
12 长 的 数据 到 msgs [i]->buf*/ 

13 ) else ( /*7ÉSIBE*/ 

14 i2c adapter xxx setaddr (msg-»addr << 1); /* 发 送 从 设备 写 地 址 */ 

15 i2c adapter xxx wait ack(); /* 获 得 从 设备 的 ack*/ 

16 i2c adapter xxx writebytes (msgs[i]-»buf, msgs[i]-»1en); /* 读 取 msgs[i] ->len 
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i7 长 的 数据 到 msgs[i]->buf*/ 

18 } 

19 } 

20  i2c adapter xxx stop(); /* 产 生 停 止 位 */ 
Du 





























上 述 代码 实际 上 给 出 了 一 个 master xfer0 函 数 处 理 PC. 消息 数组 的 流程 ， 对 于 数组 中 的 每 个 
消息 ,判断 消息 类 型 ， 若 为 读 消 息 ， 则 赋 从 设备 地 址 为 (msg->addr << 1) |1， 否则 为 msg->addr << 
1。 对 每 个 消息 产生 一 个 开始 位 ， 紧 接着 传送 从 设备 地 址 ， 然 后 开始 数据 的 发 送 或 接收 ， 对 最 后 的 
消息 还 需 产生 一 个 停止 位 。 如 图 15.3 所 示 为 整个 master_xfer() 完 成 的 时 序 。 


设备 地 址 数据 [Ack| = | "m ACK | 第 一 条 TC 消息 

| i 最 后 一 条 
ze [apo c p m eq] sd 
开始 位 /重复 开始 位 [|W 1, 写 为 0 | e | men 


15.3 algorithm 中 master xfer 的 时 序 







































































master_xferO 函 数 模板 中 的 i2c_adapter_ xxx_start() 、i2c_adapter_ xxx setaddr(). i2c adapter 
xxx wait ack(). i2c adapter xxx readbytes(). i2c adapter xxx_writebytesO0 和 i2c adapter xxx stop() 
函数 用 于 完成 适配器 的 底层 硬件 操作 ,与 PC 适配器 和 CPU 的 具体 硬件 直接 相关 ， 需 要 由 工程 师 
根据 芯片 的 数据 手册 来 实现 。 
i2c adapter xxx teadbytesO 用 于 从 从 设备 上 接收 一 串 数 据 ，i2c_adapter_xxx_wtitebytesO 用 于 
从 设备 写 入 一 串 数 据 ， 这 两 个 函数 的 内 部 也 会 涉及 PC 总 线 协议 中 的 ACK 应 答 。 
master_xferO 函 数 的 实现 在 形式 上 会 很 多 样 ， 即 便 是 Linux 内 核 源 代 码 中 已 经 给 出 的 一 
些 PC 总 线 驱动 的 master_xfer() 函 数 ， 由 于 由 不 同 的 组 织 或 个 人 完成 ， 风 格 上 的 差别 也 非常 
大 ， 不 一 定 能 与 模板 完全 对 应 ， 如 master_xfer(0 函 数 模板 给 出 的 消息 处 理 是 顺序 进行 的 ， 而 
有 的 驱动 以 中 断 方式 来 完成 这 个 流程 (15.5 节 的 实例 即 是 如 此 )。 不 管 具体 怎么 实施 ， 流 程 
的 本 质 都 是 不 变 的 。 因 为 这 个 流程 不 以 驱动 工程 师 的 意志 为 转移 ， 最 终 由 DC 总 线 硬件 上 的 
通信 协议 决定 。 
HW PC 总 线 驱 动 会 定义 一 个 xxx c 结构 体 ， 作 为 i2c_adapter 的 algo_data( 类 似 “ 私 
有 数据 ”)， 其 中 包含 FO 消息 数组 指针 、 数 组 索引 及 PC 适配器 algorithm 访问 控制 用 的 自 旋 
锁 、 等 待 队列 等 ， 而 master_xfer0 函 数 完成 消息 数组 中 消息 的 处 理 也 可 通过 对 xxx_i2c 结构 体 
相关 成 员 的 访问 来 控制 。 代 码 清单 15.12 所 示 为 xxx_i2c 结构 体 的 定义 , 与 图 15.2 中 的 xxx_i2c 
是 对 应 的 。 
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代码 清单 15.12 xxx i2c 结构 体 模板 
BSUtrfüuct xxx 120€ 
spinlock t lock; 


3L 
2 
3 wait_queue_head t wait; 
4 GUtscUNGAE LZE nse *msg; 
5) 


unsigned int msg num; 








oo06 
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6 unsigned int msg idx; 
qi unsigned int msg ptr; 
8 ER 

9 struct i2c adapter adap; 
tO y 


1 5,4 Linux I2C 设备 驱动 


PC 设备 驱动 要 使 用 i2c_driver 和 i2c_client 数据 结构 并 填充 i2c_driver 中 的 成 员 函 数 。i2c_client 
一 般 被 包含 在 设备 的 私有 信息 结构 体 yyy_data 中 ， 而 i2c_driver 则 适合 被 定义 为 全 局 变量 并 初始 
化 ， 代 码 清单 15.13 所 示 为 已 被 初始 化 的 ic_driver。 


代码 清单 15.13 已 被 初始 化 的 i2c_driver 


lUsbtabtlo struct 120 driver yyy driver e 1 













































































2 .driver = ( 

3 -name = "yyy", 

4 lu 

5 probe = yyy probe, 
6 . remove = yyy_remove, 
7 oie teble = yyy id, 

8 


] 


15.4.1 Linux I2C 设备 驱动 的 模块 加 载 与 卸载 

PC 设备 驱动 的 模块 加 载 函 数 通用 的 方法 是 在 PC. 设备 驱动 的 模块 加 载 函 数 进行 通 过 PC 核心 
的 2c_add_driverO 函 数 添加 i2e. driver 的 工作 ， 而 在 模块 卸载 函数 中 需要 做 相反 的 工作 : 通过 了 PC 
核心 的 ic_del_driver0O 函 数 删除 i2c_driver。 代 码 清单 15.14 所 示 为 PC 设备 驱动 的 加 载 工 作 与 卸 
载 函 数 模板 。 





































































































Se nl 

2 1 

2 rern i2c add driver(&yyy driver); 
3 Jý 

4 void exit yyy exit (void) 

5 cd 

6 i2c del driver(&yyy driver); 

dq sep 


15.4.2. Linux 2C 设备 驱动 的 数据 传输 
在 了 PC 设备 上 读 写 数据 的 时 序 和 数据 通常 通过 i2c_msg 数组 组 织 , 最 后 通过 i2c_transfer0 函 数 
完成 ， 代 码 清单 15.15 所 示 为 一 个 读 取 指定 偏 移 offs 寄存 器 的 例子 。 


代码 清单 544 PC 设备 驱动 数据 传输 范例 













































































MES t eUe e 3L2X6 meer muse 1.8 

2  /* 第 一 条 消息 是 写 消息 */ 

3 msg[0].addr = client-»addr; 
4 

5 





msg[0].flags = 0; 
msg[0].len = 1; 
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eoo 


6 msg[0].buf = &offs; 

7 ”/* 第 三 条 消息 是 读 消息 */ 

8 msg[1].addr -» client-»addr; 
9 msg[1].flags » I2C M RD; 

10 msg[1].len = sizeof (buf); 
A1 msgli]l.buf = sbuf[0]l: 


3,3] i2c transfer(client-»adapter, msg, 2); 


15.4.3 Linux 的 i2c-dev.c 文件 分 析 
i2c-dev.c 文件 完全 可 以 被 看 作 一 个 PC 设备 驱动 ， 不 过 ， 它 实现 的 一 个 i2c_client 是 虚拟 、 临 
时 的 ， 随 着 设备 文件 的 打开 而 产生 ， 并 随 设 备 文件 的 关闭 而 撤销 ， 并 没有 被 添加 到 i2c_adapter 的 
clien 链表 中 。i2c-dev.c 针对 每 个 TC 适配器 生成 一 个 主 设备 号 为 89 的 设备 文件 , 实现 了 i2c driver 
的 成 员 函 数 以 及 文件 操作 接口 ， 所 以 i2c-dev.c 的 主体 是 “i2c_driver 成 员 函 数 + 字 符 设备 驱动 ”。 
i2c-dev.c 中 提供 icdev_read0、i2cdev_writeO 函 数 来 对 应 用 户 空 间 要 使 用 的 read0 和 write() 
文件 操作 接口 ， 这 两 个 函数 分 别 调 用 PC 核心 的 ic_master_recv0 和 i2c_master_send0 函 数 来 构造 
—4& FC 消息 并 引发 适配器 algorithm 通信 函数 的 调用 , 完成 消息 的 传输 , 对 应 于 如 图 15.4. 所 示 的 
时 序 。 但 是 ， 很 遗憾 ， 大 多 数 稍微 复杂 一 点 PC 设备 的 读 写 流程 并 不 对 应 于 一 条 消息 ， 往 往 需要 
e 来 进行 一 次 读 写 周期 〈 即 如 图 15.5 所 示 的 重复 开始 位 RepStart 模式 )， 这 种 
青 况 下 ， 在 应 用 层 仍 然 调 用 read0、write0 文 件 API 来 读 写 PC 设备 ， 将 不 能 正确 地 读 写 。 许 多 工 
程 师 碰 到 过 类 似 的 问题 ， 往 往 经 过 相当 长 时 间 的 调试 都 没 法 解决 PC 设备 的 读 写 ， 连 错误 的 原因 
也 无 法 找到 ， 显 然 是 对 i2cdev read()fll i2cdev_write0O 函 数 的 作用 有 所 误解 。 












































































































































































































































































































































开始 地 址 数据 停止 IDLE 


15.4 i2cdev read 和 i2cdev_write 函数 对 应 时 序 























iml 





始 | 地 址 数据 地 址 数据 停止 IDLE 









































15.5 RepStart 模式 




















鉴于 上 述 原 因 ，i2c-dev.c 中 i2cdev read0 和 i2cdev_writeO 函 数 不 具 备 太 强 的 通用 性 ， 没 有 太 
大 的 实用 价值 ， 只 能 适用 于 非 RepStart 模式 的 情况 。 对 于 两 条 以 上 消息 组 成 的 读 写 ， 在 用 户 空 间 
需要 组 织 2c. msg 消息 数组 并 调用 DPC_RDWR IOCTL 命令 。 代码 清单 15.15 所 示 为 i2cdev. ioctl() 
函数 的 框架 



























































































































































代码 清单 15.15 i2c-dev c 中 的 i2cdev ioctl 函数 


static int i2cdev ioctl(struct inode *inode, struct file *file, 
unsigned int cmd, unsigned long arg) 
{ 
struct i2c client *client - (struct i2c client *)file-»private data; 





smavee (( mol ) A 
case I2C SLAVE: 
case I2C SLAVE FORCE: 


CON OY OW a w RD 
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/* 设 置 从 设备 地 址 */ 
case I2C TENBIT: 


«o 


case I20 PEOI 
case I2C FUNCS: 
case I2C RDWR: 


return i2cdev ioctl rdrw(client, arg); 
case I2C SMBUS: 





case I2C RETRIES: 


case I2C TIMEOUT: 





default: 
return i2c control(client,cmd,arg); 


return 0; 

















的 IOCTL 包括 I2C SLAVE (设置 从 设备 地 址 )、I2C_RETRIES (没有 收 到 设备 ACK 情 
况 下 的 重 试 次 数 ， 默 认为 1 )、I2C_TIMEOU (超时 ) 以 及 I2C_RDWR。 

代码 清单 15.16 和 代码 清单 15.17 所 示 为 直接 通过 read()、write() 接 口 和 O_RDWR IOCTL 读 
写 PC 设备 的 例子 。 




















JnE 
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uk SOME SS METSS MESS MENO MSS ES SETS MSS 
cO -1 Oo O1 (€ NMnP 0:00 -J1oO0 UU 0 N»DP Oo 




























































































代码 清单 15.16 ”直接 通过 read()/write() 读 写 lC 设备 
Eee 
«linux/types.h» 
«E (exon e JL ai 
«unistd.h» 
s«stdiib.he 
«sys/types.h» 
«sys/ioctl.h» 
elIonuxJg L2 BY 
«linux/i2c-dev.h» 


includ 
includ 
includ 
includ 
includ 
includ 
includ 
includ 











AD CQ ovd. th go as der 





KDE CD ES DESC OECD CD S DE CDD, 


includ 


int main(int argc, char **argv) 
( 

unsigned int fd; 

unsigned short mem addr; 

unsigned short size; 

unsigned short idx; 

fdefine BUFF SIZE 32 

char- buf [BUFF SIZE]? 

char cswap; 


OO E EN E E A 





Koj 


union 
{ 
unsigned short addr; 


| 0 
Dep» 


N 
Ww 


char bytes[2]; 


N 
B 


) tmp; 


N N 
Oo On 


ati Weueexer zm 9» di 
printf("Use:Mn$s /dev/i2c-x mem addr sizeNn", argv[0]); 


N 
- 
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C0 C0 C) Q0 C0) Q0 Qo CO CO CO 
xp 769 s ^73 € subs 759, BO ug 


B a 
ce 
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~ 
O0. “mC aS S^ Ih 





nn wm oc m 
INC dei CX OR 


C 
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(ht Ee E GT ES 
O 0 -10 eA 


Ker. O07 MI > y COM a oos NO EX 
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return 0; 
} 
sscanf(argv[2], "$d", &mem addr); 
sscanf(argv[3], "$d", &size); 


if (size » BUFF SIZE) 
size = BUFF SIZE; 


fd = open(argv[1], O RDWR); 


dep dore A 
printf("Error on opening the device fileWin"); 
return 0; 


ioctl(fd, I2C SLAVE, 0x50); /* 设置 EEPROM 地 址 */ 
ioctl(fd, I2C TIMEOUT, 1); /* WHXBH| */ 
ioctl(fd, I2C RETRIES, 1); /* 设置 重 试 次 数 */ 

















for (idx — 0; idx < size; ttidx, ttmem addr) { 
tmp.addr = mem_addr; 
cswap = tmp.bytes[0]; 
tmp.bytes[0] = tmp.bytes[1]; 
tmp.bytes[1] = cswap; 
Wiels es dE e Empr addr 2027 
read (Ed denar [adeb] 1937 
} 
buf [size] = 0; 
close (fd); 
printf("Read $d char: $sXn", size, buf); 
return 0; 


代码 清单 15.17 通过 O_RDWR IOCTL 读 写 lC 设备 
<stdio.h> 
<linux/types.h> 
LEONE Haha 
<unistd.h> 
<stdlib.h> 
<sys/types.h> 
«sys/ioctl.h» 
«errno.h» 
«assert.h» 
include «string.h» 
Pinclude €linux/i2c.h» 
dinclude «linux/i2c-dev.h» 


includ 
includ 
includ 
includ 
includ 
includ 
includ 


#includ 











(DONEC DD CD D CD) 


includ 





int main(int argc, char **argv) 

( 

struct i2c rdwr ioctl data work queue; 
unsigned int idx; 

unsigned int fd; 

unsigned int slave address, reg address; 
unsigned char val; 
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2L ana ed 

22 NE mE 

23 

Q^. 3s. (essere «x v i 

zn printf("Usage:WMn$s /dev/i2c-x start addr reg addr*n", argv[0]); 
26 return 0; 

2 

28 

29 fd - open(argv[1], O RDWR); 

30 

SUL abe (Osee di 

o printf("Error on opening the device fileWn"); 
d return 0; 

Sa y 

35 sscanf(argv[2], "$x", &slave address); 

36 sscanf(argv[3], "$x", &reg address); 

37 

38 work queue.nmsgs = 2; /* 消息 数量 */ 

39 work queue.msgs - (struct i2c msg*)malloc(work queue.nmsgs *sizeof(struct 
40 n2 camis 

41 if (!work queue.msgs) { 

42 printf("Memory alloc errorNMn"); 

43 close (fd); 

44 return 0; 

E } 

46 

47 ioctl(fd, I2C TIMEOUT, 2); /* 设置 超时 */ 

48 ioctl(fd, I2C RETRIES, 1); /* 设置 重 试 次 数 */ 

49 

SOT ton uM apeqedddaessymmsenecmeadciecssm belio M bs T 
5i val - i; 

52 (work queue.msgs[0]).1len = 1; 

53 (work queue.msgs[0]).addr = slave address; 

54 (work queue.msgs[0]).buf = &val; 

55 

56 (work queue.msgs[1]).len = 1; 

b (work queue.msgs[1]).flags = I2C M RD; 

58 (work queue.msgs[1]).addr = slave address; 

59 (work_queue.msgs[1]).buf = &val; 

60 

61 ret = ioctl(fd, 2C RDWR, (unsigned long) &work queue); 
62 abc. (eee xe 100) 

63 printf("Error during I2C RDWR ioctl with error code: $dWn", ret); 
64 else 

65 printfti(i"reég:$02x valr$02xX0", S, wal. 

66 ] 


67 close(fd); 
(03 ed Dlr 
GS 


该 程序 位 于 虚拟 机 的 /home/lihackerdevelop/svn/ldd6410-read-only/tesi2c/i2c-base-test 目录 ， 使 
该 工具 可 指定 读 取 某 TC 控制 器 上 某 FC 从 设备 的 某 寄存 器 ,如 读 开 C 控制 器 0 上 的 地 址 为 0x18 
的 从 设备 ， 从 寄存 器 0x20 开始 读 : 

4 i2c-test /dev/i2c-0 0x18 0x20 
reg:20 val:07 
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222 
229) 
:24 
29 
226 
9527] 
828) 
929) 
e 
£219) 
uUo 
el 
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221p 


val:00 
val:00 
val:00 
val:00 
val:00 
val:00 
val:00 
val:00 
val:00 
val:00 
val:00 
val:00 
val:00 
val:00 
val:00 





Linux 的 12C 核心 、 总 线 与 设备 驱动 


S3C6410 12C 总 线 驱 动 实例 


S3C6410 12C 控制 器 硬件 描述 




















4 个 寄存 器 如 下 。 
IICCON: PC 控制 寄存 器 。 
IICSTAT: PC 状态 寄存 器 。 
IICDS: PC 收发 数据 移 位 寄存 器 。 
IICADD: PC 地 址 寄存 器 。 


S3C6410 处 理 器 内 部 集成 的 PC 控制 器 可 支持 主 、 从 两 种 模式 ， 我 们 主要 使 用 其 主 模式 。 通 
过 对 IICCON, ICDS 和 IICADD 寄存 器 的 操作 ， 可 在 PC 总线 上 产生 开始 位 、 停 止 位 、 数 据 和 地 


器 内 部 集成 了 一 个 PC 控制 器 ， 通 过 4 个 寄存 器 就 可 方便 地 对 其 进行 控 表 





HS 




















ex 


























































































































址 ， 而 传输 的 状态 则 通过 IICSTAT 寄存 器 获取 。 


15.5.2. S3C6410 I?C 总 线 驱 动 总 体 分 析 


S3C6410 的 PC 总 线 驱动 drivers/i2c/busses/i2c-s3c2410.c 支持 S3C24XX、S3C64XX、S5PC1XX 


和 S5P64XX 处 理 


























器 ， 在 我 们 使 用 的 2.6.28.6 内 核 版 本 中 ， 其 名 称 仍然 叫 2410， 显 然 是 历史 原因 









































引起 的 。 它 主要 完成 以 下 工作 。 
(1) 设计 对 应 于 
adapter xxx exit() KL R pc I] ARER EN ER PKI A o 
(2) 设计 对 应 于 i2c adapter xxx_xfer0 模 板 的 S3C6410 适配器 的 通信 方法 函数 。 

















func() 只 需 简 单 地 返回 


MANGLING HJ] J 

















i2c adapter xxx init() EE HJ. S3C6410 的 模块 加 载 函数 和 对 应 于 i2c_ 
































针对 S3C24XX、S3C64XX、S5PC1XX 和 S5P64XX 处 理 器 ，functionality0 〇 函数 sS3c24xx_i2c 








I2C FUNC I2C|[D2C FUNC SMBUS EMUL|I2C FUNC PROTOCOL 


其 支持 的 功能 。 
图 15.6 给 出 了 S3C6410 驱动 中 的 主要 函数 与 15.3 节 模 板 函 数 的 对 应 关系 ， 由 于 实现 通信 方 
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法 的 方式 不 一 样 ， 模 板 的 一 个 函数 可 能 对 应 于 S3C6410 PC 总 线 驱 动 的 多 个 函数 。 


i2c adapter xxx init () 


Bs adapter o exit 0 Ky ep Booed 
s3c24xx i2c xfer () 


s3c24xx. i2c. doxfer () 
i2c adapter xxx xfer () s3c24xx i2c message start () 
s3c24xx. i2c irq () 


i2s. s3c irq nextbyte () 


I 








i2c adap s3c init () 
s3c24xx i2c probe () 








FC 总 线 驱动 模板 S3C2410 PC 总 线 驱 动 
15.6 PC 总 线 驱动 模板 与 S3C6410 PC 总 线 驱动 的 映射 


15.5.3 S3C6410 12C 适配器 驱动 的 模块 加 载 与 卸载 
PC 适配器 驱动 被 作为 一 个 单独 的 模块 加 载 进 内 核 ， 在 模块 的 加 载 和 仓 载 函 数 中 ， 只 需 注 册 
和 注销 一 个 platform_driver 结构 体 ， 如 代码 清单 15.18 所 示 。 


代码 清单 15.18. S3C6410 I2C 总 线 驱动 的 模块 加 载 与 卸载 







































































eevee ie -aine ED cele lego S. Sci Mn (ovo. (0l) 
( 


me ret 


if (ret == 0) { 
ret = platform driver register(&s3c2440 i2c driver); 
if (ret) 


1L 

2 

3 

4 

5 ret = platform driver register($&s3c2410 i2c driver); 

6 

T 

8 

9 platform driver unregister(&s3c2410 i2c driver); 


return ret; 


Static void |. exit i2c adap s3c exit (void) 

{ 
platform driver-unregister(&s3c2410-i2c-drziver); 
platform driver unregister(&s3c2440 i2c driver); 





9 p 
20 module init (i2c .adap.s3c init); 
21 module exit(i2c adap s3c exit); 


platform driver 结构 体 包 含 了 具体 适配器 的 probeO PE Zi... removeO PA Zt. resume) PR žá e 
信息 ， 它 需要 被 定义 和 赋值 ， 如 代码 清单 15.19 所 示 。 


代码 清单 15.19 platform. driver 结构 体 


1l static struct platform driver s3c2410.i2c driver - ( 






























































2 .probe = s3c24xx i2c probe, 
3 . remove = s3c24xx_i2c_remove, 
4 .resume = s3c24xx i2c resume, 
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.driver = { 
.Owner = THIS MODULE, 
.name = TEBE He 


i 


r 























通过 Linux 内 核 源 代码 /drivers/base/platform.c XF F E X platform_driver_unregister() K Zi? 
册 platform driver 结构 体 时 ， 












































probe 指针 指向 的 s3c24xx_i2c_probe() 函 数 将 被 调用 ， 以 初始 化 




















配器 硬件 ， 如 代码 清单 15.20 所 示 。 


A 0 cep NR ob, i qex 


OD UON COR EC UD: BO T 6S. 





Mo 


20 
21 
2 
2g 
24 
DIS 
26 
27 
28 
DIO 
30 
sul 
22 
33 
34 
35 
36 
37 
38 
39 
40 
41 
42 
43 











x 


代码 清单 15.20 S3C6410 lC 总 线 驱 动 中 的 s3c24xx_i2c_probe 函数 
static int s3c24xx i2c probe(struct platform device *pdev) 
{ 
struct Sebo: 120 Is 
struct s3c2410 platform i2c *pdata; 
struct resource *res; 
int ret; 


pdata = pdev-»dev.platform data; 

aig MO OE Nee di 
dev err(&pdev-»dev, "no platform data\n"); 
return -EINVAL; 


i2c -» kzalloc(sizeof(struct s3c24xx i2c), GFP KERNEL); 
aum iae» el 
dev err(&pdev-»dev, "no memory for stateNn"); 
return -ENOMEM; 


sStrlopy(i26-»5adap.name, "s302410-12c", slzeofil2c-5adàáp.name)); 


i2c-»adap.owner = THIS MODULE; 

i2c-»adap.algo ~ &s3c24xx i2c algorithm; 
i2c-»adap.retries = 2; 

i2c-»adap.class —- I2C CLASS HWMON | I2C CLASS SPD; 
T20-5Utx sep = 50; 


Spin lock init(&i2c-»lock); 
init waitqueue head(&i2c-»wait); 


/* 发 现时 钟 并 使 能 它 */ 





i2c->dev = &pdev-»dev; 
i2c->clk = clk get (&pdev->dev, "i2c"); 
(Rl 
dev err(&pdev-»dev, "cannot get cel 
ret = -ENOENT; 
goto err noclk; 


dev dbg(&pdev-»dev, "clock source $pMn", i2c-»clk); 


clik enable(i2c-»clk); 








oo 
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44 
45 
46 
47 
48 
49 
50 
51 
52 
553 
54 
55 
56 
Sy 
58 
29 
60 
61 
62 
63 
64 
65 
66 
67 
68 
69 
7/0 
T3 
72 
73 
74 
75 
76 
77] 
78 
7/8) 
80 
81 
82 
83 
84 
85 
86 
87 
88 
89 
90 
Si 
22 
9S 
94 
95 
96 
9 
98 


/* 映射 寄存 器 */ 


res = platform get resource(pdev, IORESOURCE MEM, 0); 


if (res == NULL) ( 
dev err(&pdev-»dev, "cannot find IO resourceWMn"); 
ret = -ENOENT; 


oie nee 


i2c->ioarea = request mem region(res-»start, (res->end-res->start)+1, 
pdev-»name); 


if (i2c-»ioarea == NULL) { 
dev err(&pdev-»dev, "cannot request IOWMn"); 
ret = -ENXIO; 


goto err clk; 


i2c-»regs = ioremap(res-»start, (res-»end-res-»start)-*1); 


if (i2c-»regs == NULL) ( 
dev err(&pdev-»dev, "cannot map IONn"); 
ret = -ENXIO; 
goto err ioarea; 


dev dbg(&pdev-»dev, "registers $p ($p, $p) Nn", 
i2c-»regs, i2c-»ioarea, res); 


/* 设置 i2c 核心 需要 的 信息 */ 





le xeveleqor-eiero) (else. —. 12/07 
i2c-»adap.dev.parent = &pdev-»dev; 


/* initialise the i2c controller */ 
nou = 


if (ret != 0) 
goto err_iomap; 




















/* 申请 中 断 
u^ 





i2c-»irq = ret = platform get irq(pdev, 0); 
if (ret <= 0) ( 
dev err(&pdev-»dev, "cannt find IRQWAn"); 
goto err iomap; 


ret - request irq(i2c-»irg, s3c24xx i2c irq, IRQF DISABLED, 
dev name(&pdev-»dev), i2Cc); 


Iere pex) d 
dev err(&pdev-»dev, "cannot claim IRQ $dWMn", i2c-»irq); 
goto err iomap; 
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VOD 
CO o 
ce 


01 ret = s3c24xx i2c register cpufreq(i20c); 








OTIL MAESE e (Oe d 
03 dev err(&pdev-»dev, "failed to register cpufreq notifierin"); 
04 (GYONE(o. (eve aee 
Qs p 
06 
07 /* bus num Æ platform 数据 
Qg € 
09 
0 i2c-»adap.nr - pdata-»bus num; 
al 
2 ret = i2c add numbered adapter(&i2c-»adap); 
Si E dee x 9) A 
4 dev err(&pdev-»dev, "failed to add bus to i2c coreWMn"); 
3) goto err cpufreg; 
9. y 
ji 
8 platform set drvdata(pdev, i2c); 
名 
20 dev info(&pdev-»dev, "$s: S3C I2C adapterMn", i2c-»adap.dev.bus id); 
zl -rern 0s 
22 
2. e 
24 ] 














































































































上 述 代码 中 的 主体 工作 是 使 能 硬件 并 申请 PC 适配器 使 用 的 LO 地 址 、 中 断 号 等 ， 在 这 些 工 
作 都 完成 无 误 后 , 3 PC 核心 提供 的 ic_add_adapter0 函 数 添 加 这 个 适配器 。 当 处 理 器 包含 多 个 
EC 控制 器 时 ， 我 们 通过 板 文件 定义 的 platform 数据 中 的 bus. num 进行 区 分 。 

与 Ss3c24xx_i2c_probe() 函 数 完成 相反 功能 的 函数 是 sS3c24xx_i2c remove0 函 数 , 它 在 适配器 模 
Hl d eR CU Hl platform. driver unregister() E 2S] 3883: platform. driver If] remove 指针 方式 被 调 
xxx_i2c_remove0 的 设计 模板 如 代码 清单 15.21 所 示 。 
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代码 清单 15.24. S3C6410 ^C 总 线 驱 动 中 的 s3c24xx_i2c_remove 函数 


static int s3c24xx i2c remove(struct platform device *pdev) 
( 
struct s3c24xx i2c *i2c - platform get drvdata (pdev); 


S3c24xx i2c deregister cpufreq(i2c); 


i2c del adapter(&i2c-»adap); 
fC CIT C(I er. a9) P 


«o 0-100105 F0 n2 


clk disable(i2c-»clk); 
(cbe E(k 


iounmap(i2c-»regs); 
release resource(i2c-»ioarea); 


kfree(i2c-»ioarea); 
kfree(i2Cc); 





return 0; 


} 


Oxo cO cO Cn ob GRO RO 


N 


00G 
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代码 清单 15.20 和 代码 清单 1$.21 ! 
类 似 于 私有 信息 结构 体 ， 它 与 代码 ; 
IRH s3c24xx_i2c 结构 体 的 定义 。 



















































































到 的 s3c24xx_i2c 结构 体 进 行 适配器 所 有 
15.12 所 示 的 xxx_i2c 结构 体 模板 对 应 。 代 码 清 六 





























代码 清单 15.22”s3c24xx_i2c 结构 体 


SEruUCE SoZ 


EPECCK 
wait queue head t 
unsigned int 


pUrOGLCI2C MEO 
unsigned int 
unsigned int 


XO, o e Joh COM as OO BÓ Er 


unsigned int 
unsigned int 
unsigned int 
unsigned long 
void | iomem 


struet CLE 
struct device 


SE EOS CURT ume c tO PO CC 





«o 


20 struct resource 


2-1 Est-ce c$ acad. 


22 


enum s3c24xx i2c state 


lock; 
wait; 
suspended:1; 


*msg; 

msg num; 
iusto obs? 
msg ptr; 


tx setup; 
Se 


state; 
clkrate; 


*regs; 

人 es 

*dev; 
*ioarea; 


adap; 


23 #ifdef CONFIG CPU FREQ 


24 struct notifier block 


25 #endif 
26 ); 


freq transition; 


15.5.4 S3C6410 2C 总 线 通信 方法 





















































代码 清单 15.20 的 第 22 行 可 以 看 4 





i2c_algorithm， 代 码 清单 15.23 所 示 为 s3c24xx. i2c algorithm 的 定义 。 


代码 清单 15.23  S3C6410 的 i2c_algorithm 结构 体 


Sienna On Nn Elo nm 3 di 


2 .master _ xfer 
Seven el ne es 


























代码 清单 15.24. S3C6410 ^C 总 线 驱 动 的 master_xfer 函数 


static int s3c24xx i2c xfer(struct i2c adapter *adap, 


1 
2 
S. ^ 
4 


Struct s3c2/ xx DC vize = 


—- s3c24xx i2c xfer, 
= s3c24xx i2c func, 

















上 述 代码 第 一 行 指定 了 S3C6410 PC 总 线 通信 传输 函数 s3c24xx. i2e xfer(), XARAK 
键 ， 所 有 PC 总 线 上 对 设备 的 访问 最 终 应 该 x 
及 其 依赖 的 s3c24xx. i2e. doxfer EG IURI s3c24xx_i2c_message_start() 函 数 的 源 代码 
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H, PC 适配器 对 应 的 i2c_algorithm 结构 体 实例 为 s3c24xx 








它 来 完成 ， 代 码 清单 15.24 所 示 为 





(struct s3c24xx i2c *)adap-»algo data; 


SON OOS ECOSSE COR 


OT OU! Ws 76007 RX qe ox» 





«o 


20 


N N 
Po dpt 


22 


No R S 
OU A 


N N N 
«o 0 -J 


CO C0 Q0 C0 C0 CO CO CO CO Co 
AQ UB dos OT a SO T pet 


Bam 
e 


~ 


~ 
Ls + > > 5 0 Lp 





Coo cm 
| nt S 


C 
Co 


(dx (Ex? (Gub Ux] (xp Ox) 
«o 0 100 eA 
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int retry; 


int ret; 
for (retry = 0; retry < adap-»retries; retry++) ( 
ret - s3c24xx i2c doxfer(i2c, msgs, num); 


if (ret != -EAGAIN) 
return ret; 


dev dbg(i2c-»dev, "Retrying transmission ($d)Nn", retry); 


udelay (100); 


return -EREMOTEIO; 


Statio int s3024xx 120 -doxterisLroct S302 bos 12€: *126. 
struct i2c msg *msgs, int num) 
{ 
unsigned long timeout; 
int ret; 


albe. aba GSE AT 


if (i2c->suspended) 
return -EIO; 


ret = s3c24xx i2c set master(i2c); 
if (ret !- O0) ( 


dev err(i2c-»dev, 


"cannot get bus 


(error $d)Wn", ret); 


OG soli c SO TN IRI, 


-ENXIO); 


iicstat = readl(i2c-»regs F $3C2410 IICSTAT); 


necu Rome sitat SNP SO COTES TANIB US BUS VIDA 
iicstat &- -(S3C2410 IICSTAT TXRXEN | S3C2410 IICSTAT BUSBUSY); 
WELES CSC aues SS ENS E2 TON TESTAT 


msleep (1); 


ret = -EAGAIN; 
goto out; 


Spir bockorvrqtki2ce279o6k); 


4.2 (ej teo] = msgs; 
i2c-»msg num - mum; 

A wexer Tex = Oy 

TO nS 
i2c-»state = STATE START; 


s3c24xx i2c enable irq(i20); 
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60 s3c24xx i2c message start(i2c, msgs); 
(SiL eo vindek ceret (Lester eel) p 





62 

63 timeout - wait event timeout(i2c-»wait, i2c-»msg num -- 0, Hz * 5); 
64 

Goret 2e- e ee] "ate bp 

66 

67 if (timeout -- 0) 

68 dev dbg(i2c-»dev, "timeout Nin"); 

69 else if (ret !- num) 

70 dev dbg(i2c-»dev, "incomplete xfer ($d)Wn", ret); 

3H 

72 msleep(1); /* 确保 停止 位 已 经 被 传递 */ 

7/3) 

74 out: 

75 return ret; 

me I 

AI 

78 static void s3c24xx i2c message start(struct s3c24xx i2c *i2c, 
79 struct i2c msg *msg) 

SUME 

Sie tar eeeh = neg eee e exque) cx le 


82 unsigned long stat; 
83 unsigned long iiccon; 


84 

85 mstar 0 

86 stat S $S$3C2410 IICSTAT TXRXEN; 

87 

[e abe se ene e BAC Jut D 3t 

89 stat |» S3C2410 IICSTAT MASTER RX; 
90 addr |» 1; 

91 } else 

92 stat |= S3C2410 IICSTAT MASTER TX; 
IS 

94 if (msg-»flags & I2C M REV DIR ADDR) 

95 addr ^= 1; 

96 

97 s3c24xx i2c enable ack(i2c); 

98 


99 iiccon -» readl(i2c-»regs * $3C2410 IICCON); 

00 writel(stat, i2c-»regs -* S3C2410 IICSTAT); 

01 

De gev dhqol20- devi "STARTI SOSIX to PIICSTAT, $02* t0 DX". stat, addr)s 
03 writeb(addr, i2c-2regs — S3C2410 ITCDS); 

04 

05 ndelay(i2c-»5tx setup); 

06 

UJ devodbollizo-sdew, We Oe Ca er 

ÜB-writel(liccon, i2c-2regs 4 S3C24I0 IIOCONY: 





09 

10 stat |» S3C2410 IICSTAT START; 

11 writel(stat, i2c-»regs -* S3C2410 IICSTAT); 
124 


























s3c24xx i2c xfer P Xt] H] s3c24xx_i2c_doxfer(0) 函 数 传输 PC 消息 ， 第 8 行 的 循环 意味 着 
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E iX adap->retries 次 。 








s3c24xx_i2c_doxfer() 首 先 将 S3C6410 的 PC 适配器 设置 为 PC 主 设备 , 其 后 初始 化 s3c24xx_i2c 





结构 体 ， 


s3c24xx i2c message start() |j S3C6410 适配器 对 应 的 控制 寄存 器 ， 向 PC 从 设备 传递 开 
始 位 和 从 设备 地 址 。 
上 述 代码 只 是 启动 了 IC 消息 数组 的 传输 周期 ， 并 没有 完整 实现 图 15.3 中 给 出 的 algorithm 










































































使 能 PC 中 断 ， 并 调用 s3c24xx_i2c_message_start() 函 数 启动 PC 消息 的 传输 。 
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master xfer 流程 。 这 个 流程 的 完整 实现 需要 借助 PC 适配器 上 的 中 断 来 步 步 推 进 。 代 码 清单 1525 
所 示 为 S3C6410 PC 适配器 中 断 处 理 函 数 以 及 其 依赖 的 is_s3c_irq_nextbyte0 函 数 的 源 代码 。 


OCR 有 ROW 





NO MN PN 
in ere ce ale tel 


NO NO M2 P2 
oO Oi! 4 0€) 


Uc GO. NOS TO. BO 
PE CPGE TO 31 


SEE COME CO NE CONE CORE COME CONI COMEOO) 
jp d WOO —J 08 UV "O9. NO. 







































































代码 清单 15.25. S3C6410 PC 适配器 中 断 处 理 函 数 
SEE 
( 
sbructos3c2Uxx 2O i2 = bev bd; 
unsigned long status; 
unsigned long tmp; 


Status - readl(i2c-»regs P $3C2410 IICSTAT); 
if (status & S3C2410 IICSTAT ARBITR) ( 


if (i2c-»5state == STATE IDLE) ( 
tmp = readl(i2c-»regs k $3C2410 IICCON); 
tmp &= ~S3C2410 IICCON IRQPEND; 
writel(tmp, i2c-»regs «* 3S3C2410 IICCON); 
GOLO- OUE? 























i2s s3c irq nextbyte(i2c, status);/* jEfefü LIERE DEE */ 


out: 
return IRQ HANDLED; 


static int i2s s3c irq nextbyte(struct s3c24xx i2c *i2c, unsigned long iicstat) 
( 

unsigned long tmp; 

unsigned char byte; 

int ret = 0; 


Switch (i2c-»state) ( 
case STATE IDLE: 
goto out; 
break; 
Case STATE STOP: 
S3c24xx i2c disable irq(i20); 
goto out ack; 
case STATE START: 
/* 我 们 最 近 做 的 一 件 事 是 启动 一 个 新 T^c 消息 */ 
nece sire Seat SES 9 2 IONS SAEPE ASIDE S S 
!(i2c-»msg-»flags & I2C M IGNORE NAK)) { 
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42 /* 没有 收 到 ACK */ 
43 S9oc24xxe12c08stop(ui2c E RREMOBZBREO)S 
44 (GKoxt(o) (Obl exe sp 
ESI } 
46 
47 if (i2c-»msg-»flags & I2C M RD) 
48 i2c-»state = STATE READ; 
49 else 
50 i2c->state = STATE WRITE; 
Si 
52 /* 仅 一 条 消息 ， 而 且 长 度 为 0〈 主 要 用 于 适配器 探测 ) ， 发 送 停止 位 */ 
59 if (is lastmsg(i2c) && i2c-»msg-»len == 0) ( 
54 ocu ood ON 
55 GOCO (lE ACK 
56 j 
57 
58 if (i2c-»5state == STATE READ) 
59 goto prepare_read; 
60 AS 
61 case STATE WRITE: 
62 
63 retry write: 
64 if (!is msgend(i2c)) ( 
65 pee = abre user exte [abe ee 
66 writeb(byte, i2c-»regs * S3C2410 IICDS); 
67 ndelay (i2c->tx sep); 
68 ES 
69 /* 推进 到 下 一 条 消息 */ 
70 2 So - Ds 
qal TG NS 
122 re ee 
TS) 
74 /* 检查 是 否 要 为 该 消息 产生 开始 位 */ 
75 if (i2c->msg->flags & I2C M NOSTART) { 
76 (I nS  3D2XC AWp dem) di 
ER So O2 AXAR COPI NES EEN A 
78 } 
TS) goto retry write; 
80 keles i 
81 /* 发 送 新 的 开始 位 */ 
82 S3c24xx i2c message start(i2c, i2c-»msg); 
83 i2c-»state = STATE START; 
84 ) 
85 I CE 
86 s3c24xx i2c stop(i2c, 0);/* send stop */ 
87 ) 
88 break; 
89 case STATE READ: 
90 /* 有 一 个 字 节 可 读 ， 看 是 否 还 有 消息 要 处 理 */ 
91 if (!(i2c-»msg-»5flags & I2C M IGNORE NAK) && 
92 Iu (nesemegdasiu2 co E osea tms 26) A 
9S 
94 if (Get e Ste die é S3C24IU IICSTAF LASTBIT) f 
S5 dev dbg(i2c-»dev, "READ: No AckNn"); 
96 
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VOD 
- 


S3c24xx i2c stop(i2c, -ECONNREFUSED); 
goto out ack; 


\D o 
C a cu 0. 
bk C 


byte = readb(i2c-»regs + S$3C2410 IICDS); 
i2c-»msg-»buf[i2c-»msg ptr-*-*] - byte; 


QOO 
心 WwW N 


prepare_read: 
da rsemsgiltasti2z c) a ene oee ove omnes 
aog ae enne EAS) 


O O xD 
- O O! 


Soc245x 120 disable ack{(1i2ey; 


} else if (is_msgend(i2c)) { 
/* 还 有 消息 要 处 理 吗 ? */ 
ab. (ater San 





S3c24xx i2c stop(i2c, 0);/* last message, send stop and complete */ 
) else { 
/* 推进 到 下 一 条 消息 */ 


2 0 














2 TS 
dL ZG NN 





e a 
KQ. 0D. Jody €T wc US DS. Ft CO uw: 


N 
e 


break; 


NO CBORTTISO: 
(o5 dE» de 


/* irae */ 
out ack: 
25 tmp —- readl(i2c-»regs -* S3C2410 IICCON); 
26 tmp &—- «S3C2410 IICCON IRQPEND; 
2 We tmp, 2ce-»regse s 99U24m 0 NT NDS 
cB OU 
29 return ret; 
SOS 


中 断 处 理 函 数 s3c24xx i2c irq E OBS SE A] H] i2s_s3c_irq_nextbyte0 函 数 进行 传输 工作 的 进 一 
步 推进 。i2s_s3c_irq_nextbyte0 函 数 通 过 switch(i2c->state) 语 名 分 成 i2c-»state 的 不 同 状态 进行 处 理 ， 
在 每 种 状态 下 ， 先 检查 i2c->state 的 状态 与 硬件 寄存 器 应 该 处 于 的 状态 是 否 一 致 ， 如 果 不 一 致 ， 则 
证 明 有 误 ， 直 接 返 回 。 当 PC 处 于 读 状态 STATE READ 或 写 状态 STATE WRITE 时 ， 通 过 
is_lastmsgO 函 数 判断 是 否 传输 的 是 最 后 一 条 TC 消息 ， 如 果 是 ， 则 产生 停止 位 ， 否 则 通过 


i2c->msg_idx++、i2c->msg++ 推 进 到 下 一 条 消息 。 


N 
心 































































































































































































































































































1 5.6 AT24XX EEPROM 的 PC 设备 驱动 实例 





























drivers/i2c/chips/at24.c 文件 支持 大 多 数 PC 接口 的 EEPROM， 正如 我 们 之 前 所 述 ， 一 个 具体 
的 PC 设备 个 驱动 由 两 部 分 组 成 ， 一 部 分 是 i2c_driver， 用 于 将 设备 挂 接 于 PC 总 线 ， 一 类 是 设备 
本 身 的 驱动 。 对 于 EEPROM 而 言 ， 设 备 本 身 的 驱动 以 bin_attribute 二 进 制 sysfs 结 点 形式 呈现 。 
代码 清单 15.26 给 出 了 该 驱动 的 
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No N PN 
hor 6c 


ho^ doc No: BE 
oO O1! 4 C 


NO NS PK 
X Oro ST 


CO C0 CO C0 Qo CO CO CO CO CO 
Ur OU xd Oy cV Se coo eU 


(S. Wess he Hess Wes 
ce 


~ 
co + a PE 01» CQ N50 HG 





~ 
Koj 


代码 清单 15.26 AT24XX EEPROM 驱动 
/* bin attribute A */ 


static ssize t at24 bin read(struct kobject *kobj, struct bin attribute *attr, 
ne op domi b otr, setze t COUME) 

( 

struct at24 data. *at24* 

ssize t retval = 0; 


at24 = dev get drvdata(container of(kobj, struct device, kobj)); 


while (count) ( 
ssize t status; 


Status = at24 eeprom read(at24, buf, off, count); 


return retval; 


} 


static ssize t at24 bin write(struct kobject *kobj, struct bin attribute *attr, 
(logus sigen Io ee 1e. (Quei EE ic (crono) 

{ 

struct atz4 data *at24; 

ssize t retval = 0; 


at24 = dev get drvdata(container of(kobj, struct device, kobj)); 


while (count) { 
ssize t status; 


Status = at24 eeprom write(at24, buf, off, count); 


/* i2c driver NB) */ 


static const struct i2c device id at24 ids[] = ( 
( "24c00", AT24 DEVICE MAGIC(128 / 8, AT24 FLAG TAKE8ADDR) ], 
qt web. iw ipai Mee (uLg27 7 Gr (0) Jm 


A dg que 

REND TORNS 5 p 

}; 

MODULE DEVICE TABLE(i2c, at24 ids); 
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static int at24 probe(struct i2c client *client, const struct i2c device id *id) 


1 














/* 以 sysfs 二 进 制 结 点 的 形式 呈现 eeprom 数据 */ 

at24-»bin.attr.name = "eeprom"; 

at24-»bin.attr.mode - chip.flags & AT24 FLAG IRUGO ? S IRUGO : S IRUSR; 
at24-»bin.read = at24 bin read; 

at24-»bin.size = chip.byte len; 


at24-»bin.write = at24 bin write; 


err = sysfs create bin file(&client-»dev.kobj, &at24-»bin); 
if (err) 


goto err clients; 


i2c set clientdata(client, at24); 


static int - devexit at24 remove(struüct 12c client *client) 
{ 
stovet atz4 data *at24; 


abo, aL 


at24 = i2c get clientdata (client); 
sysfs remove bin file(&client-»dev.kobj, &at24-»bin); 


for (i = 1; i < at24-»num addresses; i-*-) 
i2c unregister device (at24-»client[i]); 


static -struct 120 driver- at24 driver = f 
.driver = { 
.name = "at24", 
.owner = THIS_MODULE, 
), 
.probe = at24 probe, 
.remove =  devexit p(at24 remove), 
.id table = at24 ids, 
; 


Storti mE INe duepDAL ausi (OoLOL) 

( 

io limit - rounddown pow of two(io limit); 
return i2c add driver(&at24 driver); 

} 

module init(at24 init); 


static void exit at24 exit(void) 


{ 
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108 i2c del driver(&at24 driver); 
WOSE T 
110 module_exit (at24_exit); 


上 述 代 码 中 的 1 一 40 行 对 应 EEPROM 驱动 本 身 的 读 写实 现 即 bin. attribute 驱动 , 之 后 的 一 部 
分 是 i2c_driver， 两 者 在 i2c_driver 的 probe0、remove0 函 数 中 建立 关联 。i2c_driver 的 probe) ER 
初始 化 并 通过 第 66 行 的 sysfs_create_bin_file0 注 册 了 二 进 制 sysfs 结 点 , 而 remove) RAUR 
第 81 行 的 sysfs_remove_bin file() 注 销 了 sysfs 结 点 。 
第 16 行 调用 的 at24_eeprom_read() 和 第 36 行 调用 的 at24. eeprom. write(0) 通 过 i2c_msg 和 i2c_ 
transfer 完成 实际 的 数据 传输 。 

drivers/i2c/chips/at24.c 不 依赖 于 具体 的 CPU 和 PC 控制 器 硬件 特性 ， 因 此 ， 如 果菜 一 电路 板 
包含 该 外 设 , 只 需要 在 板 文件 中 添加 对 应 的 i2ce_board info， 如 对 于 LDD6410 在 arch/arm/mach- 
s3c6410/ mach-ldd6410.c 中 添加 的 信息 为 : 


static struct i2c board info i2c devs0[]  Jinitdata = ( 
t I2C BOARD ONIS 21029. - 0x50} dep 































































































































































































}; 
此 后 ,我 们 在 LDD6410 上 透 过 /sys/class/i2c-adapter/i2c-0/0-0050/eeprom 文件 结 点 即 可 操作 连 
接 的 EEPROM。 


IA z 


Linux PC 驱动 体系 结构 有 相当 的 复杂 度 ， 它 主要 由 3 部 分 组 成 ， 即 PC Heb. PC 总 线 驱动 
和 PC 设备 驱动 。FC 核心 是 PC 总 线 驱动 和 TcC 设备 驱动 的 中 间 枢 纽 ， 它 以 通用 的 、 与 平台 无 关 
的 接口 实现 了 PC 中 设备 与 适配器 的 沟通 。FC 总 线 驱动 填充 i2c adapter 和 i2c_algorithm 结构 体 ， 
PC 设备 驱动 填充 i2c driver 结构 体 并 实现 其 本 身 所 对 应 设备 类 型 的 驱动 。 

另外 , 系统 中 i2c-dev.c 文件 定义 的 主 设备 号 为 89 的 设备 可 以 方便 地 给 应 用 程序 提供 读 写 PC 
设备 寄存 器 的 能 力 ， 使 得 工程 师 大 多 数 时 候 并 不 需要 为 具体 的 TC 设备 驱动 定义 文件 操作 接口 。 
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网 络 设备 是 完成 用 户 数据 包 在 网 络 媒介 上 发 送 和 接收 的 设备 , 它 将 上 
层 协议 传递 下 来 的 数据 包 以 特定 的 媒介 访问 控制 方式 进行 发 送 , 并 将 接收 
到 的 数据 包 传递 给 上 层 协议 。 

与 字符 设备 和 块 设备 不 同 ， 网 络 设备 并 不 对 应 于 /dev 目录 下 的 文件 ， 
应 用 程序 最 终 使 用 套 接 字 (socket) 完成 与 网 络 设备 的 接口 。 因 而 在 网 络 
设备 身上 并 不 能 体现 出 “一 切 都 是 文件 ”的 思想 。 
Linux 系统 对 网 络 设备 驱动 定义 了 4 个 层次 ， 这 4 个 层次 为 网 络 协议 

网 络 设备 接口 层 、 提 供 实际 功能 的 设备 驱动 功能 层 和 网 络 设备 与 
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接口 


媒介 








WI Ml 


在 本 章 中 ，16.1 节 讲 解 Linux 网 络 设备 驱动 的 层次 结构 ， 描 述 
层次 各 自 的 作用 以 及 它们 是 如 何 协 同 合作 以 实现 向 下 驱动 网 络 设 备 硬件 、 
向 上 提供 数据 包 收 发 接口 能 力 的 。16.2 一 16.8 节 主 要 讲解 设备 驱动 功能 层 
的 各 主要 函数 和 数据 结构 ， 包 括 设备 注册 与 注销 、 设 备 初始 化 、 数 据 包 收 
发 函数 、 打 开 与 释放 函数 等 ， 在 分 析 的 基础 上 给 出 了 抽象 的 设计 模板 。 
16.9 节 介 绍 了 DM9000 网卡 的 设备 驱动 及 其 在 LDD6410 开 发 板 上 的 移植 。 
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Linux 网 络 设备 驱动 的 结构 


Linux 网 络 设备 驱动 程序 的 体系 结构 如 图 16.1 所 示 ， 从 上 到 下 可 以 划分 为 4 层 ， 依 次 为 网 络 
协议 接口 层 、 网 络 设备 接口 层 、 提 供 实际 功能 的 设备 驱动 功能 层 以 及 网 络 设备 与 媒介 层 ， 这 4 
的 作用 如 下 所 示 。 
(1) 网 络 协议 接口 层 向 网 络 层 协 议 提 供 统 一 的 数据 包 收 发 接口 ， 不 论 上 层 协议 为 ARP 还 是 
JP， 都 通过 dev_queue_xmitO 函 数 发 送 数据 ， 并 通过 netif rx0 〇 函数 接收 数据 。 这 一 层 的 存在 使 得 
上 层 协 议 独 立 于 具体 的 设备 。 
(2) 网 络 设备 接口 层 向 协议 接口 层 提供 统一 的 用 于 描述 具体 网 络 设备 属性 和 操作 的 结构 体 
net_device， 该 结构 体 是 设备 驱动 功能 层 中 各 函数 的 容器 。 实 际 上 ， 网 络 设备 接口 层 从 宏观 上 规划 
具体 操作 硬件 的 设备 驱动 功能 层 的 结构 。 

(3) 设备 驱动 功能 层 各 函数 是 网 络 设备 接口 层 net_device 数据 结构 的 具体 成 员 ， 是 驱使 网 络 
设备 硬件 完成 相应 动作 的 程序 ， 它 通过 hard_start_xmit() 函 数 启 动 发 送 操 作 ， 并 通过 网 络 设备 上 的 
中 断 触发 接收 操作 。 
(4). 网 络 设备 与 媒介 层 是 完成 数据 包 发 送 和 接收 的 物理 实体 ， 包 括 网 络 适 配器 和 有 具体 的 传输 
媒介 ， 网 络 适配器 被 设备 驱动 功能 层 中 的 函数 物理 上 驱动 。 对 于 Linux 系统 而 言 ， 网 络 设备 和 媒 
介 都 可 以 是 虚拟 的 。 
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数据 包 发 送 数据 包 接 收 
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数据 包 发 送 中 断 处 理 (数据 | ww yp os 二 


网 络 物理 设备 媒介 网 络 设备 与 媒介 层 


16.1 Linux 网 络 设备 驱动 程序 的 体系 结构 












































在 设计 具体 的 网 络 设备 驱动 程序 时 ， 我 们 需要 完成 的 主要 工作 是 编写 设备 驱动 功能 层 的 相关 
函数 以 填充 net. device 数据 结构 的 内 容 并 将 net. device 注册 入 内 核 。 
16.1.1 网 络 协议 接口 层 


网 络 协议 接口 层 最 主要 的 功能 是 给 上 层 协 议 提供 了 透明 的 数据 包 发 送 和 接收 接口 。 当 上 层 
ARP 或 IP 需要 发 送 数 据 包 时 ， 它 将 调用 网 络 协议 接口 层 的 dev_queue_xmit() 函 数 发 送 该 数据 
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包 ， 同 时 需 传递 给 该 函数 一 个 指向 struct sk. buff 数据 


dev queue xmit (struct sk buff * skb ); 


司 样 地 ， 上 层 对 数据 包 的 接收 也 通过 向 netif rx A Z0 638 — 
来 完成 。netif rx0 函 数 的 原型 为 : 


int netif rx(struct sk buff *skb); 

sk buff 结构 体 非常 重要 ， 定 义 于 include/linux/skbuff.h 文件 ， 它 的 含义 为 “ 套 接 字 缓冲 区 ”， 
用 于 在 Linux 网 络 子 系统 中 的 各 层 之 间 传 递 数据 ， 是 Linux 网 络 子 系统 数据 传递 的 “中 枢 神 经 ”。 
当 发 送 数据 包 时 ，Linux 内 核 的 网 络 处 理 模块 必须 建立 一 个 包含 要 传输 的 数据 包 的 sk. buff, 
然后 将 sk buff 递交 给 下 层 ， 各 层 在 sk buff 中 添加 不 同 的 协议 头 直至 交 给 网 络 设备 发 送 。 同 样 地 ， 
当 网 络 设备 从 网 络 媒介 上 接收 到 数据 包 后 ， 它 必须 将 接收 到 的 数据 转换 为 sk. buff 数据 结构 并 传 
递 给 上 层 ， 各 层 剥 去 相应 的 协议 头 直至 交 给 用 户 。 

代码 清单 16.1 列 出 了 sk buff 结构 体 的 几 个 关键 数据 成 员 ， 其 中 head 为 整个 缓冲 区 的 头 指 针 ， 
data 为 有 效 数 据 的 头 指针 ，tail 为 其 尾部 位 置 ， 
分 别 为 传输 层 、 网 络 层 和 MAC 层 的 包头 位 置 。 


结构 的 指针 。dev_queue_ xmit() 函 数 的 原型 为 : 





























个 struct sk buff 数据 结 构 的 指针 
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而 transport header. network header. mac header 










































































代码 清单 16.1 ” 套 接 字 缓冲 区 sk buff 

JL So eons wl 

2 

Bi unsigned int len, 

4 data len; 

5 ERG mac len, 

6 hdr len; 

Ti SER 

8 sk buff data. t transport header; 

n sk buff data t network header; 

10 Sk buff data t mac header; 

EI P 

12 Sk buff data t tails 

L3 Ge Joe Cee LE ends 

14 unsigned char *head, 

t5 *data; 

I$ NE 

下 面 我 们 来 分 析 套 接 字 缓冲 区 涉及 的 操作 函数 ，Linux 套 接 字 缓 冲 区 文 持 分 配 、 释 放 、 变 更 
等 功能 函数 。 

(OD 分 配 。 




















Linux 内 核 用 于 分 配套 接 字 缓冲 区 的 函数 有 : 


Struct sk buff *alloc skb(unsigned int len, 











Oo ie prroritw) 
struct sk buff *dev alloc skb(unsigned int len); 


alloc_skb0 函 数 分 配 一 个 套 接 字 缓 冲 区 和 一 个 数据 缓冲 区 ， 参 数 len 为 数据 缓冲 区 的 空间 大 小 ， 
通常 以 LL_CACHE_BYTES 字 节 (对 于 ARM 为 32) 对 齐 ， 参 数 priority 为 内 存 分 配 的 优先 级 。 
dev alloc skb0 函 数 以 GFP_ATOMIC 优先 级 进行 skb 的 分 配 













































































(2) 释放 。 
Linux 内 核 用 于 释放 套 接 字 缓冲 区 的 函数 有 : 
void kfree skb(struct sk buff *skb); 


void dev kfree skb(struct sk buff *skb); 
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void dev kfree skb irq(struct sk buff *skb); 
void dev kfree skb any(struct sk buff *skb); 


上 述 函 数 用 于 释放 被 alloc_skbO 函 数 分 配 的 套 接 字 缓冲 区 和 数据 缓冲 区 。 

Linux 内 核 内 部 使 用 kree_skb0O 函 数 ， 而 网 络 设备 驱动 程序 中 则 最 好 用 dev kfree skb(. 
dev kfree skb irq0 或 dev kfree skb any0 函 数 进行 套 接 字 缓冲 区 的 释放 。 其 中 ，dev_kfree skb() 
函数 用 于 非 中 断 上 下 文 ，dev_kfree skb irqO ES ZI HJ T "Pr E P. m dev kfree skb any0O 函 数 则 
在 中 断 和 非 中 断 上 下 文中 缘 可 采用 。 

(3) 变更 。 

Linux 内 核 中 可 以 用 如 下 函数 在 缓冲 区 尾部 增加 数据 ; 

unsigned char *skb put(struct sk buff *skb, unsigned int len); 

它 会 导致 skb->tail 后 移 len, ifi skb->len 增加 len 的 大 小 。 通 常 ， 设 备 驱 动 的 收 数据 处 理 中 会 
调用 此 函数 。 

Linux 内 核 中 可 以 用 如 下 函数 在 缓冲 区 开头 增加 数据 ; 

unsigned char *skb push(struct sk buff *skb, unsigned int len); 

它 会 导致 skb->data 前 移 len, M skb->len 增加 len 的 大 小 。 与 该 函数 完成 相反 功能 的 函数 是 
skb_pull0， 它 可 以 在 缓冲 区 开头 移 除数 据 。 

对 于 一 个 空 的 缓冲 区 而 言 ， 调 用 如 下 函数 可 以 调整 缓冲 区 的 头 部 : 

static inline void skb reserve(struct sk buff *skb, int len); 


它 会 将 skb->data 和 skb->tail 同时 后 移 len. 


16.1.2 ”网 络 设备 接口 层 

网 络 设备 接口 层 的 主要 功能 是 为 千变万化 的 网 络 设备 定义 了 统一 、 抽 象 的 数据 结构 net device 
结构 体 ， 以 不 变 应 万 变 ， 实 现 多 种 硬件 在 软件 层次 上 的 统一 。 

net device 结构 体 在 内 核 中指 代 一 个 网 络 设备 ， 定 义 于 include/linux/netdevice.h 文件 ， 网 络 设 

































































































































































































































































































































































































































































备 驱动 程序 只 需 通过 填充 net device 的 具体 成 员 并 注册 net_device 即 可 实现 硬件 操作 函数 与 内 核 
的 挂 接 。 

net device 是 一 个 巨大 的 结构 体 ， 包 含 网 络 设备 的 属性 描述 和 操作 接口 ， 下 面 介 绍 其 中 的 一 
些 关 键 成 员 。 





(1) 全 局 信息 。 

char name [IFNAMESIZ]; 

name 是 网 络 设备 的 名 称 。 

int (*init) (struct net device *dev); 

init 为 设备 初始 化 函数 指针 ， 如 果 这 个 指针 被 设置 了 ， 则 网 络 设备 被 注册 时 将 调用 该 函数 完 
BU net device 结构 体 的 初始 化 。 但 是 , 设备 驱动 程序 可 以 不 实现 这 个 函数 并 将 其 赋值 为 NULL。 

(2) 硬件 信息 。 


unsigned long mem end; 
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unsigned long mem start; 
mem start 和 mem end 分 别 定义 了 设备 所 使 用 的 共享 内 存 的 起 始 和 结束 地 址 。 


unsigned long base addr; 























unsigned char irg; 
unsigned char Xf port; 
unsigned char dma; 
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base addr 为 网 络 设 备 IO 基地 址 。 




















irq 为 设备 使 用 的 

















Br. 


if port 指定 多 端口 设备 使 用 哪 一 个 端口 ， 








持 正 PORT IOBASE2 ( 同 轴 电缆 ) 和 IF PORT _10BASET〔 双 绞 线 )， 则 可 使 / 






































dma 指定 分 配给 设备 的 DMA 通道 。 





(3) 接口 信息 。 














unsigned short hard header len; 


hard header len 是 网 络 设备 的 硬件 头 长 度 ， 在 以 太 网 设备 的 初始 化 函数 ， 


ETH HLEN, 


unsigned 


HU 14. 





unsigned mtu; 











short type; 


type 是 接口 的 硬件 类 型 。 














mtu 指 最 大 传输 单元 (MTU)。 








unsigned char dev. 


addr[MAX ADDR LEN]; 


unsigned char broadcast[MAX ADDR LEN]; 


dev addr[ ]. broadcast[ ] 无 符号 字符 数组 ， 分 别 用 了 
太 网 而 言 ， 这 两 个 地 址 的 长 度 都 为 6 个 字 节 。 




















EE 
rii H 




















驱动 程序 从 硬件 上 读 出 并 1] 


unsigned short flags; 





flags 指 网 络 接 口 标志 ， 以 IFF (interface flags) 开头 ， 部 分 标志 由 内 核 来 管 
口 初始 化 时 被 设置 以 说 明 设 备 接口 

















的 能 力 和 特性 。 接 口 标志 包括 IFF UP (〈 当 设备 被 激活 并 可 以 开 
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该 字段 仅 针 对 多 端口 设备 。 例 如 ， 如 果 设 备 同 时 支 
AB. 
























































存放 设备 的 硬件 地 址 和 广播 地 址 。 对 于 以 














以 太 网 设备 的 广播 地 址 为 6 个 0xFF， 而 MAC 地 址 
HAT] dev addr[ ] 中 。 














理 ， 其 他 的 在 接 
































始 发 送 数 据 包 时 ， 内 核 设置 该 标志 )、IFF AUTOMEDIA (设备 可 在 多 种 媒介 间 切 换 )、 
IFF_BROADCAST (人 允许 广播 )、IFF_DEBUG 


IFF LOOPBACK € 





EII), I 

















IFF POINTOPOINT (È 
(4) 设备 操作 函数 。 


Ime 





int 


口 连接 到 点 到 点 链 路 ) 


(*open) (struct net device *dev); 
(*stop) (struct net device *dev); 











open) PA Zi If] fF 


























函数 的 作 


IE 








] 是 打开 网 络 接口 设备 , 获 
j 是 停止 网 络 接口 


(*hard start xmit) 














设备 ， 与 open(0) 函 数 的 作 | 






































(调试 模式 ， 可 | 











的 详细 程度 入 





于 控制 printk 调 








FF MULTICAST (人 允许 组 播 )、IFF_NOARP (接口 不 能 执行 ARP)、 








Ak 
SF o 











得 设备 需要 的 IO 地址、 IRQ, DMA 通道 等 。stop() 
3 相反。 
































(struct sk buff *skb,struct net device *dev); 














hard start xmit() EA ASADAR ELE X, RAA KENY HJ hard. start xmit EG 2408 , 














需要 向 其 传 入 一 个 sk_buff 结构 体 指针 ， 以 使 得 驱动 程序 能 获取 从 上 层 传递 下 来 的 数据 包 。 


(*tx timeout) (struct net device *dev); 


当 数 据 包 的 发 送 超时 时 ，tx_timeout 0 函数 会 被 调用 ,该 函数 需 采 取 重 新 启动 数据 包 发 送 过 程 





void 










































































uu 








或 重新 启动 硬件 等 措施 来 恢复 网 络 设备 到 正常 状态 。 





E 


(*hard_header) 





(eruet Ska ue sk 


b, 


struct net device *dev, 


unsigned short type, 


WE 
wold *saddr. 
unsigned len 


); 











hard_headerO 函 数 完成 硬件 帧 头 填充 ， 返 回 

















填充 的 字 节 数 。 传 入 该 函数 的 参数 包括 sk_buff 指 
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针 、 设 备 指针 、 协 议 类 型 、 目 的 地 址 、 源 地 址 以 及 数据 长 度 。 对 于 以 太 网 设备 而 言 ， 将 内 核 提 供 
的 eth_header() 函 数 赋值 给 hard. header 指针 即 可 。 

struct net device stats* (*get stats) (struct net device *dev); 

get. stats() EK Zt H F 3 3 99d 28 VE $e TAS d. ERA net device stats. 结构 体 。 
net device stats 结构 体 保 存 了 网 络 设备 详细 的 流量 统计 信息 ， 如 发 送 和 接收 到 的 数据 包 数 、 字 节 
数 等 ， 详 见 16.8 W. 

EEC 


int (*set config) (struct net device *dev, struct ifmap *map); 
int (*set mac address) (struct net device *dev, void *addr); 


do ioctl0 函 数 用 于 进行 设备 特定 的 IO fist 
set_config() 函 数 用 于 配置 接口 ， 可 用 于 改变 设备 的 IO 地 址 和 中 断 号 。 
set mac address() FK ZI H T- Ve EL $€ I] MAC 地 址 。 


const struct ethtool ops *ethtool ops; 


上 述 结 构 体 中 的 一 系列 成 员 函 数 用 于 更 改 或 报告 网 络 设备 的 设置 ， 主 要 包括 get settings. 
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set settings. get wol. set wol. get eeprom, get ringparam. set ringparam 等 成 员 函 数 。 

void (*poll controller) (struct net device *dev); 

在 内 核 配置 了 NET_POLL_ CONTROLLER 的 情况 下 ,为 了 支持 纯粹 的 netconsole( 如 用 于 kgdb 
调试 )， 可 以 为 网 络 设备 驱动 实现 poll_controller0) 成 员 函 数 ， 它 完全 以 轮 询 方式 接收 数据 包 。 

net device 结构 体 的 上 述 成 员 需要 根据 对 应 网 络 设备 的 具体 情况 在 设备 初始 化 时 被 填充 ， 详 
见 16.3 节 。 

(5) 辅助 成 员 。 


unsigned long trans start; 

















































































































unsigned long last rx; 

trans start. 记录 最 后 的 数据 包 开 始 发 送 时 的 时 间 戳 ，last_rx 记录 最 后 一 次 接收 到 数据 包 时 的 时 
间 戳 ， 这 两 个 时 间 恰 记录 的 都 是 jiffies， 驱 动 程序 应 维护 这 两 个 成 员 。 

Ol ee 

priv 为 设备 的 私有 信息 指针 ， 与 flp->private_data 的 地 位 相当 。 设 备 驱 动 程序 中 应 该 以 
netdev_priv0 〇 函数 获得 该 指针 。 
通常 情况 下 ， 网 络 设备 驱动 以 中 断 方式 接收 数据 包 ， 而 poll_controller0 则 采用 纯 轮 询 方式 ， 
另外 一 种 数据 接收 方式 是 NAPI (New API) 其 数据 接收 流程 如 下 为 “接收 中 断 来 临 一 一 关闭 接收 
中 断 以 轮 询 方式 接收 所 有 数据 包 直 到 收 空 开启 接收 中 断 一 一 接收 中 断 来 临 ……: ”。 内 核 中 
提供 了 如 下 与 NAPI 相关 的 API: 


static inline void netif napi add(struct net device *dev, 















































































































































































































































struct napi struct *napi, 

mae flelexoylb1) (EE mejan SAE "Un uev) 

int weight); 
static inline void netif napi del(struct napi struct *napi); 
以 上 两 个 函数 分 别 用 于 初始 化 和 移 除 一 个 NAPI，netif napi add) 8f) poll 参数 是 NAPI 要 调度 

执行 的 轮 询 函数 。 

static inline void napi enable(struct napi struct *n); 
static inline void napi disable(struct napi struct *n); 
以 上 两 个 函数 分 别 用 于 使 能 和 禁止 NAPI 调度 。 


static inline int napi schedule prep(struct napi struct *n); 
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该 函数 用 于 检查 NAPI 是 否 可 以 调度 ， 而 napi _ schedule0) 函 数 用 于 调度 轮 询 实 例 的 运行 ， 其 原 





static inline void napi schedule(struct napi struct *n); 
在 NAPI 处 理 完 成 的 时 候 应 该 调用 : 


static inline void napi complete(struct napi struct *n); 


16.1.3 ”设备 驱动 功能 层 

net device 结构 体 的 成 员 《〈 属 性 和 函数 指针 ) 需要 被 设备 驱动 功能 层 的 具体 数值 和 函数 赋予 。 
对 于 具体 的 设备 xxx， 工 程 师 应 该 编写 设备 驱动 功能 层 的 函数 ， 这 些 函 数 形 如 xxx_open()、 
XXX_Sstop()、xXxx_tx()、xxx_hard header(). xxx get stats()、xxx_tx_timeoutO 等 
于 网 络 数据 包 的 接收 可 由 中 断 引 发 ， 设 备 驱 动 功能 层 中 另 一 个 主体 部 分 将 是 中 断 处 理 函 数 ， 
它 负 责 读 取 硬 件 上 接收 的 数据 包 并 传送 给 上 层 协 议 ， 可 能 包含 xxx_interrupt0 和 xxx. rxOBSZIG AT 
完成 中 断 类 型 判断 等 基本 的 工作 ， 后 者 则 需 完成 数据 包 的 生成 和 递交 上 层 等 复杂 工作 。 

16.2—16.8 节 将 对 上 述 函 数 进行 详细 分 析 并 给 出 参考 设计 模板 。 

对 于 特定 的 设备 ， 我 们 还 可 以 定义 其 相关 私有 数据 和 操作 ， 并 封装 为 一 个 私有 信息 结构 体 
xxx_private， 让 其 指针 被 赋值 给 net device 的 priv 成 员 。xxx_private 结构 体 中 可 包含 设备 特殊 的 
属性 和 操作 、 自 旋 锁 与 信号 量 、 定 时 器 以 及 统计 信息 等 ， 由 工程 师 自 定 义 。 


16.1.4 网 络 设备 与 媒介 层 

网 络 设备 与 媒介 层 直接 对 应 于 实际 的 硬件 设备 。 为 了 给 设备 的 物理 配置 和 寄存 器 操作 一 个 更 
一 般 的 描述 ， 我 们 可 以 定义 一 组 宏和 一 组 访问 设备 内 部 寄存 器 的 函数 ， 有 具体 的 宏和 函数 与 特定 的 
硬件 紧密 相关 。 代 码 清单 16.2 所 示 为 相应 的 设计 范例 。 


代码 清单 16.2 ”网 络 设备 底层 硬件 操作 






















































































































































































































































































































































































































































































/* 寄存 器 定义 */ 
#define DATA REG 0x0004 
#define CMD REG 0x0008 


/* 寄存 器 读 写 函 数 */ 


Static ul6 xxx readword(u32 base addr, int portno) 





OD oo 6m abs bo. INE go 


/* 读 取 寄 存 器 的 值 并 返回 */ 








«o 





Static void xxx writeword(u32 base addr, int portno, ul6 value) 


/* 向 寄存 器 写 入 数值 */ 





FF FF 
SQ N 吕 


16.2 网络 设 各 驱动 的 注册 与 注销 


网 络 设 备 驱 动 的 注册 与 注销 使 








UI 











用 成 对 出 现 的 register netdev() fll unregister_netdev() 函 数 完成 ， 
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这 两 个 函数 的 原型 为 : 
int register netdev(struct net device *dev); 
void unregister netdev(struct net device *dev); 


这 两 个 函数 都 接收 一 个 net device 结构 体 指针 为 参数 ， 可 见 net device 数据 结构 在 网 络 设备 
驱动 中 的 核心 地 位 。 

net device 的 生成 和 成 员 的 赋值 并 非 一 定 要 由 工程 
帮助 我 们 填充 : 


#define alloc netdev(sizeof priv, name, setup) \ 

















HO 











师 逐 个 杀 自 动手 完成 ， 可 以 利用 下 面 的 宏 























alloc netdev mq(sizeof priv, name, setup, 1) 
#define alloc etherdev(sizeof priv) alloc etherdev mq(sizeof priv, 1) 


alloc netdev 宏 引 用 的 alloc_etherdev_mq0 函 数 的 原型 为 : 


struct net device *alloc netdev mq(int sizeof priv, const char *name, 





void (*setup) (struct net device *), unsigned int queue count); 
alloc_netdev_mq() 函 数 生成 一 个 net. device 结构 体 ， 对 其 成 员 赋 值 并 返回 该 结构 体 的 指针 。 第 
一 个 参数 为 设备 私有 成 员 的 大 小 ， 第 二 个 参数 为 设备 名 ， 第 三 个 参数 为 net_device 的 setup PA ži 
指针 ， 第 四 个 参数 为 要 分 配 的 子 队 列 的 数量 。setup0 函 数 接收 的 参数 也 为 struct net. device 指针 ， 
用 于 预 置 net_device 成 员 的 值 。 
alloc_etherdev() 是 alloc_netdev0O 针 对 以 太 网 的 “快捷 ”函数 ， 这 从 alloc_etherdev() 引 用 的 
alloc_etherdev_mq0 函 数 的 源 代 码 可 以 看 出 ， 如 代码 清单 16.3 所 示 。 


代码 清单 16.3 alloc_etherdev() 函 数 


Struct net device *alloc etherdev mq(int sizeof priv, unsigned int queue count) 
( 

/* UL ether setup 为 alloc netdev md 的 setup 参数 */ 

return alloc netdev mq(sizeof priv, "eth$d", ether setup, queue count); 





































































































(dx. qim (09) 1R9k E 


} 
上 述 代码 中 的 第 4 行 传 入 alloc netdev mO RKA 6 =N ether setupOPA ZG unb, 


ether setup Æ H Linux 内 核 提 供 的 一 个 对 以 太 网 设备 net device 结构 体 中 公有 成 员 快速 赋值 的 
- 与 alloc_enetdev() 和 alloc etherdev() FK ŽK DÍE, — BUE net. device 结构 体 的 函数 为 : 


void free netdev(struct net device *dev); 

net device 结构 体 的 分 配 和 网 络 设备 驱动 注册 需 在 网 络 设备 驱动 程序 的 模块 加 载 函 数 中 进行 ， 
而 net device 结构 体 的 释放 和 网 络 设备 驱动 的 注销 则 需 在 模块 卸载 函数 中 完成 ， 如 代码 清单 16.4 
所 示 。 

































































































































































代码 清单 16.4 ”网 络 设备 驱动 程序 的 模块 加 载 函 数 模 板 


int xxx init module (void) 


{ 











/* 分 配 net device 结构 体 并 对 其 成 员 赋值 */ 
Xxx dev — alloc netdev(slizeof(Struct xxx priv), "sn9d0", xxx init); 
if (xxx dev == NULL) 

. /* 4 Bi net device AJ */ 











/* 注册 net device 结构 体 */ 
0 if ((result = register netdev (xxx dev))) 





rm £O s. ho LA WAccOd UNA 
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T 

Z 计 

3 

4 void xxx cleanup (void) 

S. 

6 ere 

7 /* 注销 net device 结构 体 */ 
8 unregister netdev (xxx dev); 
9 /* 释放 net device 结构 体 */ 
20 free netdev (xxx dev); 
ali } 


网 络 设备 的 初始 化 


网 络 设备 的 初始 化 主要 需要 完成 如 下 几 个 方面 的 工作 





o 





























e ”进行 硬件 上 的 准备 工作 ， 检 查 网 络 设备 是 否 存 在 ， 如 果 存在 ， 则 检测 设备 所 使 用 的 硬件 



























































e 进行 软件 接口 上 的 准备 工作 ， 分 配 net device 结构 体 并 对 其 数据 和 函数 指名 




















| 成员 赋值 。 

































































e ”获得 设备 的 私有 人 
等 并 发 或 同步 机 种 


QI 















































c; 


， 则 需 对 其 进行 初始 化 。 





息 指针 并 初始 化 其 各 成 员 的 值 。 如 果 私有 信息 中 包括 自 旋 锁 或 信号 量 























对 net_device 结构 体 成 员 及 私有 数据 的 赋值 都 可 能 需要 与 硬件 初始 化 工作 协同 进行 ， 即 硬件 












































检测 出 了 相应 的 资源 ， 需 要 根据 检测 结果 填充 net device 结构 体 成 员 和 私有 数据 。 
一 个 网 络 设备 驱动 初始 化 函数 的 模板 如 代码 清单 16.5 所 示 ， 具 体 的 设备 驱动 入 
不 一 定 完全 和 本 模板 一 样 ， 但 是 其 本 质 过 程 是 一 致 的 。 


代码 清单 16.5 ”网 络 设备 驱动 的 初始 化 函数 模板 





















































































































































1 void xxx init(struct net device *dev) 
2 { 
3 /* 设 备 的 私有 信息 结构 体 */ 
4 Su Ue eV PIV; 
5 

6 /* 检查 设备 是 否 存在 和 设备 所 使 用 的 硬件 资源 */ 
Wn 

8 

9 /* 初始 化 以 太 网 设备 的 公用 成 员 */ 

0 ether setup (dev); 

dL 

2 /* 设 置 设备 的 成 员 函 数 指针 */ 

3 dev-»open = xxx open; 

4 dev->stop = xxx release; 

2 dev-»set config = xxx config; 

6 dev-»hard start xmit - xxx tx; 

d dev-»do ioctl -» xxx ioctl; 

8 dev-»5get stats = xxx stats; 

9 dev->change mtu = xxx change mtu; 
20 dev-»2rebuild header = xxx rebuild header; 
ZEN dev-»hard header = xxx header; 

















J 始 化 函数 并 
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E dev-»tx timeout = xxx tx timeout; 
2d dev-»watchdog timeo = timeout; 
24 

25 /* 取得 私有 信息 ， 并 初始 化 它 */ 

26 priv = netdev priv (dev); 

27 enel /* 初始 化 设备 私有 数据 区 */ 
PORE 





上 述 代 码 第 7 行 的 xxx_hw_initO 函 数 完成 硬件 相关 的 初始 化 操作 如 下 。 

e 探测 xxx 网 络 设备 是 否 存 在 。 探测 的 方法 类 似 于 数学 上 的 “ 反 证 法 ” 即 先 假设 存在 设备 
Xxx， 访 问 该 设备 ， 如 果 设 备 的 表现 与 预期 的 一 致 ， 就 确定 设备 存在 ; 否则 ， 假 设 错误 ， 
设备 xxx 不 存在 。 

e 探测 设备 的 具体 硬件 配置 。 一 些 设备 驱动 编写 得 非常 通用 ， 对 于 同类 的 设备 使 用 统一 的 

区 动 ， 我 们 需要 在 初始 化 时 探测 设备 的 具体 型 号 。 另 外 ， 即 便 是 同一 设备 ， 在 硬件 上 的 
配置 也 可 能 不 一 样 ， 我 们 也 可 以 探测 设备 所 使 用 的 硬件 资源 。 

申请 设备 所 需要 的 硬件 资源 ， 如 用 request region) KGT IO 端口 的 申请 等 ， 但 是 这 

个 过 程 可 以 放 在 设备 的 打开 函数 xxx_open0 中 完成 。 
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16.4 网络 设备 的 打开 与 释放 


网 络 设备 的 打开 函数 需要 完成 如 下 工作 。 

e 使 能 设备 使 用 的 硬件 资源 ， 申 请 IO 区 域 、 中 断 和 DMA 通道 等 。 
e 调用 Linux 内 核 提 供 的 netif start queueO 函 数 ， 激 活 设备 发 送 队 列 。 
网 络 设备 的 关闭 函数 需要 完成 如 下 工作 。 
e 调用 Linux 内 核 提 供 的 netif stop queue0 函 数 ， 停 止 设 备 传输 包 。 

e 释放 设备 所 使 用 的 IO 区 域 、 中 断 和 DMA 资源 。 

Linux 内 核 提供 的 netif start queue()fll netif stop queue0 两 个 函数 的 原型 为 : 


void netif start queue(struct net device *dev); 




































































— 















































—H 












































void netif stop queue (struct net device *dev); 


根据 以 上 分 析 ， 可 得 出 如 代码 清单 16.6 所 示 的 网 络 设备 打开 和 释放 函数 的 模板 。 
代码 清单 16.6 网络 设备 打开 和 释放 函数 模板 







































































1 int xxx open(struct net device *dev) 

2 { 

3 /* 申请 端口 、IRO 等 ， 类 似 于 fops->open */ 
4 ret = request irq(dev-»irg, &xxx interrupt, 0, dev-»name, dev); 
5 iet 

6 netif start queue (dev); 

T S5 

8 } 

9 

10 int xxx release(struct net device *dev) 
JL d { 

12 /* 释放 端口 、IRQ 等 ， 类 似 于 fops-»close */ 
W3 free_irq(dev->irq, dev); 
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netif stop queue(dev); /* can't transmit any more */ 


IE NS] 效 据 发 送 流程 





从 16.1 节 网 络 设备 驱动 程序 的 结构 分 析 可 知 ，Linux 网 络 子 系统 在 发 送 数据 包 时 ， 会 调用 驱 
动 程序 提供 的 hard_start_transmit() 函 数 ， 该 函数 用 于 启动 数据 包 的 发 送 。 在 设备 初始 化 的 时 候 ， 
这 个 函数 指针 需 被 初始 化 指向 设备 的 xxx. tx ER C 



























































网 络 设备 驱动 完成 数据 包 发 送 的 流程 如 下 。 
































(1) 网 络 设备 驱动 程序 从 上 层 协 议 传 递 过 来 的 sk. buff. 参数 获得 数据 包 的 有 效 数据 和 长 度 ， 


将 有 效 数 据 放 入 临时 缓冲 区 。 





























(2) 对 于 以 太 网 ， 如 果 有 效 数据 的 长 度 小 于 以 太 网 冲突 检测 所 要 求 数 据 帧 的 最 小 长 度 


ETH ZLEN， 则 给 临 - 缓冲 区 的 末尾 填充 0。 












































(3) 设置 硬件 的 寄存 器 ， 驱 使 网 络 设备 进行 数据 发 送 操作 。 
完成 以 上 3 个 步骤 的 网 络 设备 驱动 程序 的 数据 包 发 送 函 数 的 模板 如 代码 清单 16.7 所 示 。 


Acn TRANS ED dex 


OO 





N 
Ceme MY 


2 


















































代码 清单 16.7 ”网 络 设备 驱 动 程序 的 数据 包 发 送 函 数 模板 


(ek knee nv es 
{ 





int len; 
char *data, shortpkt [ETH ZLEN]; 
if (xxx send available(...)) { /* 发 送 队 列 未 满 ， 可 以 发 送 */ 


/* 获得 有 效 数据 指针 和 长 度 */ 
data = skb->data; 

len = skb->len; 

if (len < ETH ZLEN) { 

/* 如 果 帧 长 小 于 以 太 网 帧 最 小 长 度 ， 补 0 */ 
memset(shortpkt, 0, ETH ZLEN); 
memcpy(shortpkt, skb-»data, skb-»1len); 
len - ETH ZLEN; 
data = shortpkt; 

} 





dev-»trans start = jiffies; /* i sn */ 





/* 设置 硬件 寄存 器 让 硬件 把 数据 包 发 送出 去 */ 
xxx hw tx(data, len, dev); 
I elsa { 

netif stop queue (dev); 


} 
} 

















xx H 





E gig | 























EE 特别 要 强调 第 23 行 对 netif stop queue0O 的 调用 ， 当 发 送 队 列 为 满 或 因 其 他 原因 来 不 及 发 
EEk FRE, 此 函数 阻止 上 层 继续 向 网 络 设备 驱动 传递 数据 包 ， 当 忙 于 发 送 的 
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数据 包 o TX 结束 的 中 断 处 理 中 ， 应 该 调用 netif wake_queue() 唤 醒 被 阻塞 的 上 层 ， 
以 启动 它 继续 向 网 络 设备 驱动 传送 数据 包 。 
SPACE 超时 时 ， 意 味 着 当前 的 发 送 操作 失败 或 硬件 已 陷入 未 知 状 态 ， 此 时 ， 数 据 包 发 送 


























超时 处 理 函 数 xxx_tx_timeoutO 将 被 调用 。 这 个 函数 也 需要 调用 Linux 内 核 提 供 的 netif wake | 
queueO 函 数 重 新 启动 设备 发 送 队 列 ， 如 代码 清单 16.8 所 示 。 


代码 清单 16.8 ”网 络 设备 驱动 程序 的 数据 包 发 送 超时 函数 模板 


void xxx tx timeout(struct net device *dev) 


{ 


























E 


























P EIE EE (dev); /* 重新 启动 设备 发 送 队列 */ 
j 
从 前 文 可 知 ，netif wake queue()fll netif stop queue0O 是 数据 发 送 流程 中 要 调用 的 两 个 非常 重 
要 的 函数 ， 分 别 用 于 唤醒 和 阻止 上 层 向 下 传送 数据 包 ,， 它们 的 原型 定义 于 include/linux/netdevice.h， 
如 下 : 


static inline void netif wake queue (struct net device *dev); 


(dg. de v9. S qe 





















































static inline void netif stop queue(struct net device *dev); 


16.0 效 据 接收 流程 


网 络 设备 接收 数据 的 主要 方法 是 由 中 断 引 发 设备 的 中 断 处 理 函 数 ， 中 断 处 理 函 数 判断 中 断 类 
型 ， 如 果 为 接收 中 断 ， 则 读 取 接收 到 的 数据 ， 分 配 sk buffer 数据 结构 和 数据 缓冲 区 ， 将 接收 到 的 
数据 复制 到 数据 缓冲 区 ， 并 调用 netif rx0 函 数 将 sk. buffer 传递 给 上 层 协议 。 代 码 清单 16.9 所 示 
为 完成 这 一 过 程 的 函数 模板 。 


代码 清单 16.9 网 络 设备 驱动 的 中 断 处 理 函 数 模板 











































































































































































































1l static void xxx interrupt(int irg, void *dev id) 
2 { 

3 ehe 

4 switch (status &ISQ EVENT MASK) { 

5 case ISQ RECEIVER EVENT: 

6 /* 获取 数据 包 */ 

y Xxx rx(dev); 

8 break; 

9 /* 其 他 类 型 的 中 断 */ 

0 } 

io p 

2. static void xxx rx(struct xxx device *dev) 
S 

4 835 

5 length = get rev len (...); 

6 分 配 新 的 套 接 字 缓冲 区 */ 

7 Skb = dev alloc skb(length + 2); 

8 

9 Skb reserve(skb, 2); /* 7 
20 Skb-»dev = dev; 
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2 

22 /* 读 取 硬 件 上 接收 到 的 数据 */ 

DIS insw(ioaddr * RX FRAME PORT, skb put(skb, length), length »» 1); 
24 if (length &1) 

os Skb-»data[length - 1] = inw(ioaddr + RX FRAME PORT); 
26 

27 /* 获取 上 层 协议 类 型 */ 

28 Skb-»protocol = eth type trans(skb, dev); 

2/9 

30 /* 把 数据 包 交 给 上 层 */ 

31 netif rx(skb); 

319 

33 /* 记录 接收 时 间 惟 */ 

34 dev->last_rx = jiffies; 

SS 

36 






























































从 上 述 代 码 的 第 4—7 行 可 以 看 出 ， 当 设备 的 中 断 处 理 程序 判断 中 断 类 型 为 数据 包 接 收 中 断 
时 ， 它 调用 第 12—36 定义 的 xxx_rx0 函 数 完成 更 深入 的 数据 包 接 收工 作 。xxx_rx0 函 数 代 码 中 的 
第 15 行 从 硬件 读 取 到 接收 数据 包 有 效 数据 的 长 度 ， 第 16 一 19 行 分 配 sk_buff 和 数据 缓冲 区 ， 第 
22—25 行 读 取 硬 件 上 接收 到 的 数据 并 放 入 数据 缓冲 区 ， 第 27 一 28 行 解析 接收 数据 包 上 层 协 议 的 
类 型 ， 最 后 ， 第 30 一 31 行 代码 将 数据 包 上 交 给 上 层 协 议 。 

如 果 是 NAPI 兼容 的 设备 驱动 ， 则 可 以 通过 poll 方式 接收 数据 包 。 这 种 情况 下 ， 我 们 需要 为 
该 设备 驱动 提供 作为 netif napi add0 参 数 的 xxx_poll0 函 数 ， 如 代码 清单 16.10 所 示 。 


代码 清单 16.10 ”网 络 设备 驱动 的 poll 函数 模板 


static int xxx poll(struct napi struct napi int budget) 


































































































































































































2 { 
3 int npackets = 0; 
4 struct sk buff *skb; 
9 Struct xxx priv *priv = container of(napi, struct xxx priv, napi); 
6 struct xxx packet *pkt; 
3 
8 while (npackets < budget && priv-»rx queue) { 
9 /* 从 队列 中 取出 数据 包 */ 
0 pkt = xxx dequeue buf (dev); 
JL 
2 /* 接 下 来 的 处 理 ， 和 中 断 触发 的 数据 包 接收 一 致 */ 
3 skb = dev alloc skb(pkt-»datalen + 2); 
4 I 
5 Skb reserve(skb, 2); 
6 memcpy(skb put(skb, pkt-»datalen), pkt-»data, pkt-^datalen); 
Ji Skb-»dev = dev; 
8 Skb-»protocol = eth type trans(skb, dev); 
9 /* 调 用 netif receive skb， 而 不 是 net _ rx， 将 数据 包 交 给 上 层 协 议 */ 
20 netif receive skb(skb); 
2d 
22 /* 更 改 统计 数据 */ 
23 priv-sstats.rx packets tE 
24 priv-»5stats.rx bytes += pkt->datalen; 
25 xxx release_buffer (pkt); 
26 npackets-t-*t; 
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28 } 

28 if (npackets « budget) ( 

zn napi complete (napi); 

30 xxx enable rx int (…); /* 再 次 使 能 网 络 设备 的 接收 中 断 */ 
31 } 

32 return npackets; 

SON 








上 述 代 码 中 的 budget 是 在 初始 化 阶段 分 配给 接口 的 weight fi, poll 函数 每 次 只 能 接收 
最 多 tudgst 数量 的 数据 包 。 第 8 行 的 while0 循 环 读 取 设备 的 接收 缓冲 区 ， 读 取 数 据 包 并 提 
交 给 上 层 。 这 个 过 程 和 中 断 触发 的 数据 包 接 收 过 程 一 致 ， 但 是 最 后 使 用 netif receive skb() 
函数 而 非 netif rxO 函 数 将 数据 包 提 交 给 上 层 。 这 里 体现 出 了 中 断 处 理 机 制 和 轮 询 机 制 之 间 
的 差别 。 
当 一 个 轮 询 过 程 结束 时 ， 第 29 行 代码 调用 napi complete0 宣 布 这 一 消息 ， 而 第 30 行 代码 则 
次 启动 网 络 设备 的 接收 中 断 。 
虽然 NAPI 兼容 的 设备 驱动 以 poll 方式 接收 数据 包 , 但 是 仍然 需要 首次 数据 包 接 收 中 断 
来 触发 poll 过 程 。 与 数据 包 的 中 断 接收 方式 不 同 的 是 ， 以 轮 询 方 式 接收 数据 包 时 ， 当 第 一 

中 断 发 生 后 ， 中 断 处 理 程序 要 禁止 设备 的 数据 包 接 收 中 断 并 调度 NAPI， 如 代码 清单 16.11 
所 示 。 



























































































































































































































































代码 清单 16.11 网 络 设备 驱动 的 poll 中 断 处理 函 数 模板 


Static void xxx poll interrupt(int irg, void *dev id) 
{ 
switch (status &ISQ EVENT MASK) { 
case ISQ RECEIVER EVENT: 
… /* 获取 数据 包 */ 
xxx disable rx int(...); /* 禁止 接收 中 断 */ 
napi schedule(&priv-»napi); 





break; 


/* 其 他 类 型 的 中 断 */ 


A; Og ss cns OY. ue Or B ces 














0 
d — jg 


上 述 代码 第 7 行 的 napi schedule 0 函数 被 轮 询 方式 驱动 的 中 断 程序 调用 ， 将 设备 的 poll 方法 
添加 到 网 络 层 的 poll 处 理 队 列 中 ， 排 队 并 且 准 备 接收 数据 包 ， 最 终 触发 一 个 NET_RX SOFTIRQ 
软 中 断 ， 通 知 网 络 层 接收 数据 包 。 图 162 所 示 为 NAPI 驱动 程序 各 部 分 的 调用 关系 。 


Softnet data 






























































































































设备 硬件 中 断 "Tem 


netif rx action() 










把 设备 挂 接 上 poll. list 
关闭 中 断 


napi schedule() 


返回 中 断 








数据 包 读 取 完毕 
使 能 中 断 
把 设备 从 poll_list 清除 


napi_complete() 
16.2 NAPI 调用 关系 


在 支持 NAPI 的 网 络 设备 驱动 中 ， 通 常 还 会 进行 如 下 与 NAPI 相关 的 工作 。 
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(1) 在 私有 数据 结构 体 如 xxx. priv 中 增加 一 个 成 员 : 

struct napi strüugt napi? 

这 是 代码 清单 16.11 第 5 行 调用 container of 0 可 以 得 到 xxx. priv 类 型 指针 的 原因 

(2) 通常 会 在 设备 驱动 初始 化 时 调用 : 

netif napi add(dev, napi, xxx poll, XXX NET NAPI WEIGHT); 

(3) 通常 会 在 net device 结构 体 的 open fI. stop0 成 员 函 数 中 分 别 调用 napi enable() 和 
napi disable(). 


网 络 连接 状态 


网 络 适配器 硬件 电路 可 以 检测 出 链 路 上 是 否 有 载波 ， 载 波 反映 了 网 络 的 连接 是 否 正 常 。 网 络 
设备 驱动 可 以 通过 netif carrier on0 和 netif carrier off() 通 数 改变 设备 的 连接 状态 ， 如 果 驱 动 检测 
到 连接 状态 发 生变 化 ， 也 应 该 以 netif carrier on() 和 netif carrier_offO 函 数 显 式 地 通知 内 核 。 

除了 netif carrier on0 和 netif carrier_offO) 函 数 以 外 ,， 另 一 个 函数 netif carrier okO 可 用 于 向 调 
用 者 返回 链 路 上 的 载波 信号 是 否 存在 。 

这 几 个 函数 都 接收 一 个 net. device 设备 结构 体 指针 为 参数 ， 原 型 分 别 为 : 


void netif carrier on(struct net device *dev); 
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void netif carrier off(struct net device *dev); 
int netif carrier ok(struct net device *dev); 


网 络 设备 驱动 程序 中 可 采取 一 定 的 手段 来 检测 和 报告 链 路 状态 ， 例 如 设置 一 个 定时 器 来 对 链 
路 状态 进行 周期 性 地 检查 。 当 定时 器 到 期 之 后 ， 在 定时 器 处 理 函数 中 读 取 物 理 设 备 的 相关 寄存 器 
获得 载波 状态 ， 从 而 更 新 设备 的 连接 状态 ， 如 代码 清单 16.12 所 示 。 


代码 清单 16.12 ”网 络 设备 驱动 用 定时 器 周期 检查 链 路 状态 


Static void xxx timer(unsigned long data) 




















































































































2 { 
3 struct net device *dev = (struct net device*)data; 
4 wb Js 
E Ss 
6 ifi qiidev-Ilags STEP UP) 
7 goto set timer; 
8 
9 /* 获得 物理 上 的 连接 状态 */ 
0 Xf (bunk — xxx chk Link(dev)) 4 
1 if (!(dev->flags &IFF_RUNNING)) { 
2 netif carrier on(dev); 
B dev-»flags |= IFF RUNNING; 
4 printk(KERN DEBUG "$s: link up\n", dev-»name); 
5 } 
6 } else { 
7 if (dev->flags &IFF_RUNNING) { 
8 netif carrier off (dev); 
9 dev-»flags &- -IFF RUNNING; 
20 printk (KERN_DEBUG "$s: link down\n", dev-»name); 
2 ) 
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22 } 

23 

24 set timer: 

2/5 priv-»timer.expires - jiffies * 1 * Hz; 

26 priv-»timer.data = (unsigned long)dev; 

23) priv-»timer.function = &xxx timer; /* timer handler */ 
28 add timer(&priv-»timer); 

POSEEN 

















上 述 代码 第 10 行 调用 的 xxx_chk_link0 函 数 用 于 读 取 网 络 适配器 硬件 的 相关 寄存 器 以 获得 链 
路 连接 状态 ， 有 具体 实现 由 硬件 决定 。 当 链 路 连接 上 时 ， 第 12 行 的 netif carrier on() 函 数 显 式 地 通 
知 内 核 链 路 正常 ， 反之， 第 18 行 的 netif carrier offO 同 样 显 式 地 通知 内 核 链 路 失去 连接 。 

此 外 , 从 上 述 源 代码 还 可 以 看 出 , 定时 器 处 理 函 数 会 不 停 地 利用 第 24—28 行 代码 启动 新 的 定 
时 器 以 实现 周期 检测 的 目的 。 那 么 最 初 启动 定时 器 的 地 方 在 哪里 呢 ? 很 显然 ， 它 最 适合 在 设备 的 
打开 函数 中 完成 ， 如 代码 清单 16.13 所 示 。 






























































































































































































































































代码 清单 16.13 ”在 网 络 设备 驱动 的 打开 函数 中 初始 化 定时 器 
static int xxx open(struct net device *dev) 
{ 


struct xxx priv *priv - (struct xxx priv*)dev-»priv; 


priv-»timer.expires - jiffies * 3 * Hz; 
priv-»timer.data = (unsigned long)dev; 
priv-»timer.function - &xxx timer; /* timer handler */ 
add timer(&priv-»timer); 


px READ OO CE CONVUUM COO cde 


p CE 


10.8 参 效 设置 和 统计 数据 


在 网 络 设备 的 驱动 程序 中 还 提供 一 些 方法 供 系 统 对 设备 的 参数 进行 设置 或 读 取 设 备 相 关 
的 信息 。 
当 用 户 调用 ioctl0 函 数 ， 并 指定 SIOCSIFHWADDR 命令 时 ， 意 味 着 要 设置 这 个 设备 的 MAC 
地 址 。 设 置 网 络 设备 的 MAC 地 址 可 用 如 代码 清单 16.14 所 示 的 模板 。 










































































































































































代码 清单 16.14 设置 网 络 设备 的 MAC 地 址 


Static int set mac address(struct net device *dev, void *addr) 
{ 
if (netif running (dev)) 
return EBUSY; /* WIL */ 





/* 设置 以 太 网 的 MAC 地址 */ 


xXx det mec(dew, EGG 





return 0; 


puo oO asa OCCUR aS Soc NOCERE 


IT 
i: 
E 
ma 




































































首先 用 netif running() 宏 判断 设备 是 否 正 在 运行 ， 如 果 是 ， 则 意味 着 设备 忙 ， 此 时 
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不 允许 设置 MAC 地 址 ; 否则 ， 调 用 xxx set mac() 函 数 在 网 络 适配器 硬件 内 写 入 新 的 MAC 地 

址 。 这 要 求 设备 在 硬件 上 支持 MAC 地 址 的 修改 ,而 实际 上 ,许多 设备 并 不 提供 修改 MAC 地 址 

的 接口 。 

netif running() 宏 的 定义 为 : 

define netif running(dev) (dev->flags & IFF UP) 

当 用 户 调用 ioctlO 函 数 时 ， 若 命令 为 SIOCSIFMAP (如 在 控制 台中 运行 网 络 配置 命令 ifconfig 

就 会 引发 这 一 调用 )， 系 统 会 调用 驱动 程序 的 set_configO) 函 数 。 
系统 会 向 set_config() 函 数 传递 一 个 ifmap 结构 体 ， 该 结构 体 中 主要 包含 用 户 欲 设置 的 设备 

要 使 用 的 IO 地址 、 中 断 等 信息 。 注 意 ， 并 非 ifmap 结构 体 中 给 出 的 所 有 修改 都 是 可 以 被 接受 的 。 

实际 上 ， 大 多 数 设备 并 不 宜 包 含 set config0 函 数 。set_configO 函 数 的 例子 如 代码 清单 16.15 
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所 示 。 
代码 清单 16.15 ”网 络 设备 驱动 的 set_config 函数 模板 

1 int xxx config(struct net device *dev, struct ifmap *map) 
2 { 
3 if (netif running(dev))  /* 不 能 设置 一 个 正在 运行 状态 的 设备 */ 
4 tur = EBUSY? 
9 

6 /* 假设 不 允许 改变 1/0 地 址 */ 
y if (map->base_addr != dev->base_addr) { 

8 printk (KERN WARNING "xxx: Can't change I/O address\n"); 
9 return = EOPNOTSURP?} 

0 上 

T 

2 /* 假设 允许 改变 IRQ */ 

3 if (map->irq != dev->irq) 

4 dev->irq = map->irq; 

5 

6 return 0; 

JL e 














IH 
M 











上 述 代 码 中 的 set config0 函 数 接受 IRQ BEDA, H 
接收 这 些 信 息 的 修改 ， 要 视 硬 件 的 设计 而 定 。 

如 果 用 户 调用 iocttO 时 ， 命 令 类 型 在 SIOCDEVPRIVATE 和 SIOCDEVPRIVATE+15 之 间 ， 
系统 会 调用 驱动 程序 的 do_ioctl0 函 数 ， 进 行 设备 专用 数据 的 设置 。 这 个 设置 大 多 数 情况 下 也 
不 需要 。 

驱动 程序 还 应 提供 get statsO 函 数 用 以 向 用 户 反馈 设备 状态 和 统计 信息 ， 该 函数 返回 的 是 一 个 
net device stats 结构 体 ， 如 代码 清单 16.16 所 示 。 


代码 清单 16.16 ”网 络 设备 驱动 的 get stats 函数 模板 
struct net device stats *xxx stats(struct net device *dev) 


{ 


Struct xxx priv *priv - netdev priv (dev); 


色 设备 IO 地 址 的 修改 。 具 体 的 设备 是 否 




























































































































































































return &priv-»stats; 
} 
net device stats 结构 体 定义 在 内 核 的 include/linux/netdevice.h 文件 中 ， 它 包含 了 比较 完整 的 统 


计 人 信息， 如 代码 清单 16.17 所 示 。 


OO 
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代码 清单 16.17 net device stats 结构 体 




















k struct net_device_stats 
2 { 
8 unsigned long rx packets; /* 收 到 的 数据 包 数 */ 
4 unsigned long tx packets; /* 发 送 的 数据 包 数 */ 
5 unsigned long rx bytes; /* 收 到 的 字 节 数 */ 
6 unsigned long tx bytes; /* 发 送 的 字 节 数 */ 
7 unsigned long rx errors; /* 收 到 的 错误 数据 包 数 */ 
8 unsigned long tx errors; /* 发 生发 送 错误 的 数据 包 数 */ 
s s 
10 Je 
i 














上 述 代码 清单 只 是 列 出 了 net device stats 包含 的 主 项 目 统计 信息 ， 实 际 上 ， 这 些 项 目 还 可 以 
进一步 细 分 ，net_device_stats 中 的 其 他 信息 给 出 了 更 详细 的 子 项 目 统计 ， 详 见 Linux 源 代 码 。 
net device stats 结构 体 适宜 包含 在 设备 的 私有 信息 结构 体 中 ， 而 其 中 统计 信息 的 修改 则 应 该 
在 设备 驱动 的 与 发 送 和 接收 相关 的 具体 函数 中 完成 ， 这 些 函 数 包括 中 断 处 理 程序 、 数 据 包 发 送 函 
数 、 数 据 包 发 送 超 时 函数 和 数据 包 接 收 相 关 函 数 等 。 我 们 应 该 在 这 些 函 数 中 添加 相应 的 代码 ， 如 
代码 清单 16.18 所 示 。 


代码 清单 16.18 net device stats 结构 体 中 统计 信息 的 维护 
/* 发 送 超时 函数 */ 






























































































































































































































































2 void xxx tx timeout(struct net device *dev) 

3 

4 struct xxx priv *priv = netdev priv (dev); 

5 De 

6 priv-»stats.tx errors4*; /* 发 送 错 误 包 数 加 1 */ 

7 

8 J 

9 

0 ”/* 中 断 处 理 函数 */ 

JL static void xxx interrupt(int irg, void *dev id) 

2o wd 

3 Switch (status &ISQ EVENT MASK) { 

4 A oo 

b case ISQ TRANSMITTER EVENT: / 

6 priv-»stats.tx packets++; /* 数据 包 发 送 成 功 ，tx_packets 信息 加 1 */ 
7 netif wake queue(dev); /* 通知 上 层 协议 */ 

8 if ((status &(TX OK | TX LOST CRS | TX SQE ERROR | 
9 TX LATE COL | TX 16 COL)) !- TX OK) { /* 读 取 硬 件 上 的 出 错 标志 */ 
20 /* 根据 错误 的 不 同情 况 ， 对 net device stats 的 不 同 成 员 加 1 */ 
2a if ((status &TX_OK) == 0) 

22 Ppriv-»stats.tx errors 

23 if (status &TX LOST CRS) 

24 priv-»stats.tx carrier errorstt; 

25 if (status &TX_SQE_ERROR) 

26 priv->stats.tx heartbeat_errors++; 

27 if (status &TX LATE COL) 

28 priv-»stats.tx window errorst*; 

2 if (status &TX l6 COH) 

30 priv -stats tx aborted errors-t*; 

od } 

32 break; 
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Sg case ISQ RX MISS EVENT: 

34 priw-»stats.rx missed errors += (status >> 6); 
EID break; 

36 case ISQ TX COL EVENT: 

Cu ES lon re Isbtabus 55 60) 

38 break; 

39 } 

40 } 





上 述 代码 的 第 6 行 意味 着 在 发 送 数 据 包 超时 时 ， 将 发 生发 送 错 误 的 数据 包 数 增 1。 而 第 13— 
38 行 则 意味 着 当 网 络 设备 中 断 产 生 时 ， 中 断 处 理 程序 读 取 硬 件 的 相关 信息 以 决定 修改 net_device_ 
stats 统计 信息 中 的 哪些 项 目 和 子 项 目 ， 并 将 相应 的 项 目 增 1。 








































































































IKORO] Do9ooo 网 卡 设备 驱动 实例 


16.9.1 DM9000 网 卡 硬件 描述 


DM9000 是 开发 板 采 用 的 网 络 芯 片 ， 是 一 个 高 度 集 成 而 且 功 耗 很 低 的 高 速 网 络 控制 器 ， 可 以 
和 CPU 直 连 ， 支 持 10/100MB 以 太 网 连接 ， 芯 片 内 部 自 带 AK 双 字 节 的 SRAM GKB 用 来 发 送 ， 
13KB 用 来 接收 7)。 针 对 不 同 的 处 理 器 ， 接 口 支持 8 位 、16 位 和 32 位。 图 16.3 所 示 为 DM8900 的 


内 部 结构 框架 。 


PHYceiver 
































































































EEPROM 
接口 









MII 管理 控制 
及 MI 寄存 器 





Autonegotiation 





16.3 DM9000 以 太 网 芯片 的 内 部 结 
































在 LDD6410 开发 板 上 ，LDD6410 直接 挂 接 在 S3C6410 的 存储 器 总 线 上 ， 其 连接 原理 如 图 16.4 
所 示 。DM9000 占据 S3C6410 片 选 1 的 内 存 空间 ， 而 且 由 S3C6410 地 址 线 第 2 位 驱动 CMD 引 脚 ， 
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这 说 明 片 选 1 的 地 址 0 一 3 对 应 的 是 DM9000 的 IO 端口， 而 4 一 7 对 应 的 是 数据 端口 ， 这 一 信息 
对 于 移植 DM9000 驱动 到 LDD6410 非常 
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16.4 LDD6410 开发 板 的 DM9000 网 卡 连接 原理 
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16.9.2 DM9000 网 卡 驱 动 设计 分 析 

DM9000 网 卡 驱动 位 于 内 核 源 代码 的 drivers/net/dm9000.c， 它 基于 平台 驱动 架构 ,代码 清 
单 16.19 抽取 了 它 的 主干 。 其 核心 工作 是 实现 了 前 文 所 述 net device 结构 体 中 的 hard_start_xmit、 
open、stop、set_multicast_list、do_ioctl、tx_timeout 等 成 员 函 数 并 借助 中 断 辅助 进行 网 络 数据 包 昌 
必 发 ， 另 外 它 也 实现 了 ethtool ops 中 的 成 员 函 数 。 


代码 清单 16.19 DM9000 网 卡 驱动 
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/* Structure/enum 定义 ------------------------------- */ 
typedef struct board info { 


1L 
2 
3 
4 void  iomem *io addr;/* 寄存 带 工 /0 基地 址 大 
5 void  iomem *io data; /* 数据 I/0 基地 址 */ 
6 
3l 
8 
9 








ul6 irq; [F* 3ümQ. v 


ul6 EXPE Gn, 
































O0 C board infoot; 

1l 

A eee ne CMEC toer Sto Cei Ce ev et ee ES ETT CUR RS) 
3 

4 static const struct ethtool ops dm9000 ethtool ops = ( 
DESC CENE = dm9000 get drvinfo, 

6 .get settings = dm9000 get settings, 

y .Set settings = dm9000 set settings, 

8 .get msglevel = dm9000 get msglevel, 

9 .set msglevel = dm9000 set msglevel, 
20 .nway reset = dm9000 nway reset, 
21 — ln = dm9000 get link, 
22 .get eeprom len = dm9000 get eeprom len, 
229) .get eeprom = dm9000 get eeprom, 
24 .Set eeprom = dm9000 set eeprom, 
Z5. E 
26 
27 /* 设置 DM9000 多 播 地 址 */ 
28 static void dm9000 hash table(struct net device *dev) 
29 
30 /* 看 门 狗 超时 ， 网 络 层 将 调用 该 函数 */ 
31 static void dm9000 timeout(struct net device *dev) 
NET 
99 
34  netif stop queue (dev); 
35  netif wake queue (dev); 
36 
TEM 
38 
39 static int dm9000 start xmit(struct sk buff *skb, struct net device *dev) 
40 ( 
41 b ro 
42  /* 将 发 送 数据 包 移 至 DM9000 f] TX RAM */ 
43  writeb(DM9000 MWCMD, db-»io addr); 
44 
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45 
46 
47 
48 
49 
50 
Si 
52 
53 
54 
59 
56 
Si 
58 
59 
60 
61 
62 
63 
64 
65 
66 
67 
68 
69 
70 
Ka 
72 
13 
74 
3 
76 
77 
78 
Q9 
80 
81 
82 
83 
84 
85 
86 
ST) 
88 
89 
90 
Sri, 
92 
93 
94 
25 
96 
E 
98 
99 


(ole >> Ou (el l0 Haba, ell ol ne 
dev- >stats.tx bytes t= skb-»len; 


/* 数据 发 送 完 成 */ 
Static void dm9000 tx done(struct net device *dev, board info t *db) 
{ 


netif wake queue (dev); 


} 





/* 接收 数据 并 传递 给 上 


stabile word 


vl 


MU 





dm9000 rx(struct net device *dev) 


{ 


netif rx(Sskb); 
dev--stats.rx packets-ctt; 


static irgreturn t dm9000 interrupt(int irg, void *dev id) 
{ 


return IRQ HANDLED; 
} 

















/* 打开 网 卡 接口 */ 
static int dm9000 open(struct net device *dev) 
{ 








netif start queue (dev); 


return 0; 


} 
/* 从 phyxcer 读 一 个 word */ 


static int dm9000 phy read(struct net device *dev, int phy reg unused, int reg)(.. 


/* 向 phyxcer 写 一 个 word */ 
static vold 
dm9000 phy write(struct net device *dev, 
int phyaddr unused, int reg, int value)í...) 


GuEeNESLer 3heye Se 


dm9000 probe(struct platform device *pdev) 
{ 


/* Init network device */ 
ndev = alloc etherdev(sizeof (struct board info)); 


SET NETDEV DEV (ndev, &pdev-»dev); 


ether setup (ndev); 


; 
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alol 

















00 ndev->open = &dm9000_open; 

01 ndev-»hard start xmit = &dm9000 start xmit; 
02 ndev-»tx timeout = &dm9000 timeout; 

03 ndev-»stop = &dm9000 stop; 

04 ndev-»set multicast list = &dm9000 hash table; 
05 ndev-»ethtool ops = &dm9000 ethtool ops; 

06 ndev-»do ioctl = &dm9000 ioctl; 

07 

08 #ifdef CONFIG NET POLL CONTROLLER 

09 ndev-»poll controller - &dm9000 poll controller; 
0 #endif 

1l 

2 db-»msg enable — NETIRF MSG LINK; 

OU: 

4 db-»mii.mdio read = dm9000 phy read; 

5 db-»mii.mdio write = dm9000 phy write; 

6 

7 platform set drvdata(pdev, ndev); 

8 ret - register netdev (ndev); 

9 

20 

ZEE, 

22 

Dowd cm ECC ve xit: 

24 dm9000 drv remove(struct platform device *pdev) 
2/5 

26 struct net device *ndev - platform get drvdata (pdev); 
2 

28 platform set drvdata(pdev, NULL); 

29 

30 unregister netdev (ndev); 

31 free netdev (ndev); /* free device structure */ 
92 

Soa 

34 ] 

39 

36 static struct platform driver dm9000 driver = 
37 «driver = { 

38 . name = "dm9000", 

39 .owner = THIS MODULE, 

40 ], 

41 .probe  - dm9000 probe, 

42 .remove =  devexit p(dm9000 drv remove), 
252077 

44 

2b static int me dm9000 inrt(ovolsg) 

46 

47 return platform driver register(&dm9000 driver); 
48 

49 

50 static void exit dm9000 cleanup (void) 

eL 

52 platform driver unregister(&dm9000 driver); 

9S 

54 
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155 module init(dm9000 na 
156 module exit (dm9000 cleanup); 


DM9000 驱动 的 实现 与 具体 CPU 无 关 , 在 将 该 驱动 移植 到 特定 电路 板 时 ， 只 需要 在 板 文 件 中 
为 板 上 DM9000 对 应 平台 设备 的 寄存 器 和 数据 基地 址 进行 赋值 ， 并 指定 正确 的 IRQ 资源 ， 代 
码 16.20 给 出 了 LDD6410 开发 板 的 板 文件 中 对 DM9000 添加 的 内 容 。 





































































































代码 清单 16.20 LDD6410 板 文 件 中 的 DM9000 的 平台 设备 


1 static struct resource ldd6410 dm9000 resource[] = 
2 (OJ = 
3 .start = 0x18000000, 
4 .end = 0x18000000 + 3, 
5 .flags = IORESOURCE MEM 
6 ), 
7 [3] ms 
8 .start - 0x18000000 -* 0x4, 
9 .end  - 0x18000000 * 0x7, 
0 .flags = IORESOURCE MEM 
d or 
2 EZ m 3d 
3 Start — TRONENEN( ST 
4 .end = IRQ EINT(7), 
5 .flags - IORESOURCE IRQ | IORESOURCE IRQ HIGHLEVEL, 
$ Jj 
di 
8); 
9 
20 static struct dm9000 plat data l1dd6410 dm9000 platdata = i 
2T Eg - DM9000 PLATF 16BITONLY | DM9000 PLATF NO EEPROM, 
2 .dev addr = { Ox0, 0x16, Oxd4, 0x9f, Oxed, 0xa4 }, 
23 ); 
24 
25 static struct platform device ldd6410 dm9000 -2 ( 
26 .name - "dm9000", 
2c = 0, 
2B .num resources = ARRAY SIZE(1dd6410 dm9000 resource), 
zd .resource = ldd6410 dm9000 resource, 
30 .dev = { 
Si .platform data - &ldd6410 dm9000 platdata, 
S92— 3 
39 IF 


另外 ，LDD6410 开发 板 的 U-BOOT 也 全 面 文 持 DM9000， 这 使 得 我 们 可 以 在 U-BOOT : 

















ii 











行 网 络 命令 或 通过 tftp FE Linux 内 核 运行 ， 例 如 : 











LDD6410 


ping 192.168.1.111 


dm9000 i/o: 0x18000300, id: 0x90000a46 


MAC: 00:4 


DrherostsUach 


operating at 100M full duplex mode host 192.168.1.111 is alive 


LDD6410 


F zIma 


LDD6410 


ge: 
tftp 0xc0008000 zlImage 





dm9000 i/o: 0x18000300, id: 0x90000a46 








INUX 


Linux 网 络 设备 驱动 


IC 
operating at 100M full duplex mode 




























































































TFTP from server 192.168.1. p SUE XP address is 192.108. 1.20 
Filename 'zImage'. 

Load address: 0xc0008000 

Loading: 4SHEHEEEEEEEEEETEEE S S FEFE FE EFE TE FE TE HE FE FE FE TE FE FE HE FE FE FE TE HE FE E FE FE FE FE HE FE FE FE TE FE AE HE FE E FE EE E 
# HEFER EREEEEREREEEEE FEFE AE AE FE TE FE TE HE FE E FE TE FE FE HE FE AE FE TE FE FE HE FE E FE E E E E E E EH 
# EEREREREEEEREREEEEE FEAE AE HE FE FE FE TE HE FE E FE TE FE FE HE FE AE FE TE FE FE HE FE E FE TE HE FE E E E E H 
# TXREREESEEATAEREUEEEE FEFE AE AE FE FE FE TE HE FE E FE TE FE FE HE FE AE FE TE FE FE HE FE E FE E HE EHE E E E H 
# EERE EEREEEEEEEEEEEE FEFE AE HE FE FE FE TE HE FE AE FE TE FE FE HE FE AE FE TE FE FE HE FE AE FE TE HE FE E FE E E E H 
# TEREHREESEETAEREAEREEE RE: FEE AE AE FE TE FE TE HE FE E FE TE FE FE HE FE AE FE TE FE FE HE FE E FE E HE E E E E E H 
# EEREREREEEEREREEEEE FEFE AE HE FE TE FE FE AE FE E FE TE HE FE HE FE E E E E E E EH 

done 

Bytes transferred = 2279916 (22c9ec hex) 

启动 内 核 : 

LDD6410 # pootm 0xc0008000 

















Boot with zImage 
Starting kernel ... 


16.10 R 


Linux 网 络 设备 驱动 体系 结构 的 层次 化 设计 实现 了 对 上 层 协议 接口 的 统一 和 硬件 驱动 的 对 下 
层 多 样 化 硬件 设备 的 可 适应 。 程 序 员 需 要 完成 的 工作 集中 在 设备 驱动 功能 层 ， 网 络 设备 接口 层 
net device 结构 体 的 存在 将 千变万化 的 网 络 设备 得 以 抽象 ， 使 得 设备 功能 层 中 除数 据 包 接收 以 外 
的 主体 工作 都 由 填充 net. device 的 属性 和 函数 指针 完成 。 

在 分 析 net device 数据 结构 的 基础 上 ， 本 章 给 出 了 设备 驱动 功能 层 设 备 初始 化 、 数 据 包 收 发 、 
打开 和 释放 等 函数 的 设计 模板 ， 这 些 模 板 对 实际 设备 驱动 的 开发 具有 直接 指导 意义 。 有 了 这 些 模 
板 , 我 们 在 设计 具体 设备 的 驱动 时 , 不 再 需要 关心 程序 的 体系 , 而 可 以 集中 精力 于 硬件 操作 本 身 。 
在 Linux 网 络 子 系统 和 设备 驱动 中 ， 套 接 字 缓 冲 区 sk buff 发 挥 着 巨大 的 作用 ， 是 所 有 数据 流 
动 的 载体 。 网 络 设备 驱动 和 上 层 协 议 之 间 也 依赖 此 结构 进行 数据 包 交 互 ， 因 此 ， 我 们 要 特别 牢记 
它 的 操作 方法 。 
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在 Linux 系统 中 ， 先 后 出 现 了 音频 设备 的 3 种 框架 : 
ASoC， 本 节 将 在 介绍 数字 音频 设备 及 音频 设备 硬件 接 
OSS, ALSA 和 ASoC 驱动 的 结构 。 

17.1—17.2 节 讲 解 了 音频 设备 及 PCM、IS 和 AC'97 






















































































17.3 节 讲 解 了 Linux OSS 音频 设备 驱动 的 组 成 、mixer 接口 、dsp 接口 


















































及 用 户 空 间 编 程 方法 。 














17.4 节 讲 解 了 Linux ALSA 音频 设备 驱动 的 组 成 、card 和 组 件 管理 、 
PCM 设备 、control 接口 、AC'97 API 及 用 户 空 间 编 程 方法 。 










































































OSS, ALSA 和 

















口 的 基础 上 讲解 








硬件 接口 。 


























T 














17.5 市 讲解 了 Linux ASoC 音频 设备 驱动 的 组 成 ，Codec、CPU DAI 





和 板 驱 动 。 
17.6 节 以 LDD6410 FRIE S3C6410 通过 AC'97 接 
的 实例 讲解 了 ASoC 驱动 。 





























口外 接 WM9714 





17. na 











统 的 电路 组 成 如 图 








目前 ， 手 机 、PDA、MP3 YF BEA X WR 








包含 了 数字 音 











17.1 所 示 。 17.1 中 的 租 入 式微 控制 器 /DSP 

















频 接口 ， 通 过 这 些 接 口 连 接 外 部 的 音频 编 











成 模拟 信号 的 放大 功能 。 


解码 器 即 可 实现 声音 的 




















Linux 音频 设备 驱动 


频 设备 ， 一 个 典型 的 数字 音频 系 


HERT PCM, IS 或 AC'97 音 
AD 和 DA 转换 ， 图 中 的 功放 完 

















PCMVPS/ 


PCM/IIS/ 
AC97 
接口 


音频 纺 
解码 器 


(codec) 


控制 器 





17.1 典型 的 数字 音频 系统 电路 
































采样 的 过 程 就 是 将 通常 的 模拟 音频 信号 的 








便 构 成 了 数字 音频 文件 。 
两 者 越 吻 合 说 明 采 样 结果 越 好 。 


00:00:00.000 



































17.2 中 的 正弦 曲线 代表 原始 音 

















电信 号 转换 成 二 进 制 码 0 和 1 的 过 程 ， 


音频 编 解 码 器 是 数字 音频 系统 的 核心 ， 衡 量 它 的 主要 指标 如 下 。 
1. 





这 些 0 和 1 





























p 


























线 ， 方 格 代表 采样 后 得 到 的 结果 ， 


00:00:00.100 



































00:00:00.100 





17.2 数字 音频 采样 
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Significant Bit) 开始 ，FS 频率 等 了 


































































































































































































采样 频率 是 每 秒 钟 的 采样 次 数 ， 我 们 常 说 的 44.1kHz 采样 频率 就 是 每 秒 钟 采样 44100 次 。 理 
论 上 采样 频率 越 高 ， 转 换 精 度 越 高 ， 目 前 主流 的 采样 频率 是 48kHz。 

2. 量化 精度 

量化 精度 是 指 对 采样 数据 分 析 的 精度 ， 比 如 24bit 量化 精度 就 是 指 将 标准 电 平 信号 按照 2 
的 24 次 方 进行 分 析 ， 也 就 是 说 将 图 17.2 中 的 纵 坐 标 等 分 为 2“ 等 分 。 量 化 精度 越 高 ， 声 音 就 越 
BE. 

xz H5 Jl 

INA 冶 频 设 备 硬件 接口 
17.2.1 PCM 接口 

针对 不 同 的 数字 音频 子 系统 ， 出 现 了 几 种 微 处 理 器 或 DSP 与 音频 器 件 间 用 于 数字 转换 的 接口 。 

最 简单 的 音频 接口 是 PCM 〈 脉 冲 编码 调制 ) 接口 ， 该 接口 由 时 钟 脉 冲 CBCLKO. Wubi 


号 (FS) 及 接收 数据 (DR) 和 发 送 数据 (DX) 组 成 。 在 FS 信号 的 上 升 沿 ， 数 据 传输 从 MSB (Most 


F 采样 率 。FS 信号 之 后 开始 数据 字 的 传输 ， 单 个 的 数据 位 按 顺 




















17.2.2 
IIS 接口 





























支持 多 声 道 。 





得 一 个 独立 的 数 扩 





RBS. 
IIS 接口 


(Inter-IC Sound, X. 4 PS) 在 20 世纪 80 年 代 首 








17.2.3 AC'97 接口 
AC'97( Audio Codec 1997) 是 以 Intel 为 
与 Yamaha 共同 提出 的 规格 标准 。 与 PCM 和 














AC'97 X 

















号 校正 (SYN 
AC'97 数据 帧 
据 





序列 。 例 如 ， 


的 内 部 架构 规格 ， 它 还 具有 控制 功能 。 

















«A 
和 
时 

















F 








两 个 音频 通道 。 


音频 数据 仅 通 过 4 根 线 到 达 9 个 音频 通道 或 转换 成 














时 
































yz 

































































并 在 一 个 称 为 LRCLK (Left/Right CLOCK) 的 信号 机 制 
的 数据 队列 。 当 LRCLK 为 高 时 ， 左 声 道 数 扩 
与 PCM 相 比 ，IIS 更 适合 了 








tA 


nue 
































His 


先 被 PHILIPS 
中 经 过 多 路 转换 ， 将 两 路 音频 
LRCLK 为 低 时 ， 右 声 道 数据 被 传输 。 














用 于 消费 音 

















序 进行 传输 ， 一 个 时 钟 周期 传输 一 个 数据 字 。 
PCM 接口 很 容易 实现 , 原则 上 能 够 支持 任何 数据 方案 和 任何 采样 率 , 但 需要 每 个 音频 通道 获 











频 产品 ， 
SER 











PRERA. I4)5. IIS 的 变 体 也 支持 多 通道 的 时 分 

















J, K 











此 可 以 


的 5 个 PC 厂商 Intel; Creative Labs, NS, Analog Device 


IIS ^^f], AC97 不 只 























以 SYNC 脉冲 开始 ， 包 括 12 个 











HE ETZ 和 Pis 





20 

















“tag” REIR HA 





























于 访问 编码 的 控制 
岂 时 隙 中 哪 一 个 包含 























E 
AE 








一 种 数据 格式 ， 用 于 音频 编码 














AMORE. f 


ub 4) JUS D te 











] AC-Link 与 外 部 的 编 解码 器 相连 ，AC-Link 接口 包括 位 时 钟 (BITCLK)、 同 步 信 
CO 和 从 编码 到 处 理 器 及 从 处 理 器 中 解码 (SDATDIN 与 SDATAOUT) 的 数据 队列 。 


位 时 隙 以 及 1 个 16 位 “tag” 段 ， 共 计 256 个 数 
寄存 器 ， 而 时 阶 “3” 和 “4” 分 别 负载 左 、 





信号 


17.3 所 示 AC'97 的 
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oo 


Slot 0 1 2 3 4 5 6 7 8 9 10 11 12 


有 


SDATA OUT 
(Controller output) TAG CMD CMD PCM PCM |LINEI PCM PCM PCM PCM LINE2 | HSET IO 
ADDR | DATA |LFRONT|RFRONT| DAC |CENTER|L SURR|R SURR| LFE DAC DAC | CTRL 


| PCML | PCM RÍPCMC 





| (rH) | (rH) 上 (rH) | 


Codec ID 





Lol. i ul 
SDATA.IN STATUS|STATUS PCM PCM LINE 1 PCM LINE 2 HSET IO 
(Codec output) DATA EE ADC | Mic |RSRVD | RSRVD | RSRVD| ApC | ADC |STATUS 
SLOTREQ 3-12 


17.3 AC'97 接口 时 序 





















































PCM, IIS 和 AC'97 各 有 其 优点 和 应 用 范围 ， 例 如 在 CD、MD、MP3 随身 听 多 采用 IIS 接口 ， 
移动 电话 多 采用 PCM 接口 ， 智 能 手机 、PDA 则 多 使 用 和 PC 一 样 的 AC'97 编码 格式 。 



























































17.3.1 OSS 驱动 的 组 成 
































Oss 标准 中 有 两 个 最 基本 的 音频 设备 : mixer 〈 混 音 器 ) 和 dsp (数字 信号 处 理 器 )。 

在 声卡 的 硬件 电路 中 ，mixer 是 一 个 很 重要 的 组 成 部 分 ， 它 的 作用 是 将 多 个 信号 组 合 或 者 登 
加 在 一 起 ， 对 于 不 同 的 声卡 来 说 ， 其 混 音 器 的 作用 可 能 各 不 相同 。OSS 驱动 中 ，/dev/mixer 设备 
文件 是 应 用 程序 对 mixer 进行 操作 的 软件 接口 。 
混 音 器 电路 通常 由 两 部 分 组 成 : 输入 混 音 器 (input mixer) 和 输出 混 音 器 Coutput mixer)。 输 入 混 
音 器 负责 从 多 个 不 同 的 信号 源 接收 模拟 信号 ， 这 些 信 号 源 有 时 也 被 称 为 混 音 通道 或 者 混 音 设备 。 模 拟 
言 号 通过 增益 控制 器 和 由 软件 控制 的 音量 调节 器 ， 在 不 同 的 混 音 通道 中 进行 级 别 〈level) 调制 ， 然 后 
被 送 到 输入 混 音 器 中 进行 声音 的 合成 。 混 音 器 上 的 电子 开关 可 以 控制 哪些 通道 中 有 信和 号 与 混 音 器 相 
连 ， 有 些 声 卡 只 允许 连接 一 个 混 音 通道 作为 录音 的 音源 ， 而 有 些 声 卡 则 允许 对 混 音 通道 做 任意 的 连接 。 
经 过 输入 混 音 器 处 理 后 的 信号 仍然 为 模拟 信和 号， 它们 将 被 送 到 A/D 转换 器 进行 数字 化 处 理 。 
输出 混 音 器 的 工作 原理 与 输入 混 音 器 类 似 ， 同 样 也 有 多 个 信号 源 与 混 音 器 相连 ， 并 且 事 先 都 
过 了 增益 调节 。 当 输出 混 音 器 对 所 有 的 模拟 信号 进行 了 混合 之 后 ， 通 常 还 会 有 一 个 总 控 增 益 调 
器 来 控制 输出 声音 的 大 小 ， 此 外 还 有 一 些 音调 控制 器 来 调节 输出 声音 的 音调 。 经 过 输出 混 音 器 
理 后 的 信号 也 是 模拟 信号 ， 它 们 最 终 会 被 送 给 喇叭 或 者 其 他 的 模拟 输出 设备 。 
对 混 音 器 的 编程 包括 如 何 设置 增益 控制 器 的 级 别 ， 以 及 怎样 在 不 同 的 音源 间 进 行 切 换 ， 这 些 
操作 通常 来 讲 是 不 连续 的 ， 而 且 不 会 像 录 音 或 者 播放 那样 需要 占用 大 量 的 计算 机 资源 。 由 于 混 音 
器 的 操作 不 符合 典型 的 读 / 写 操作 模式 ， 因 此 除了 open0 和 closeO 这 两 个 系统 调用 之 外 ， 大 部 分 的 
操作 都 是 通过 ioctl0 系 统 调 用 来 完成 的 。 与 /dev/dsp 不 同 , /dev/mixer 允许 多 个 应 用 程序 同时 访问 ， 
且 混 音 器 的 设置 值 会 呆 持 到 对 应 的 设备 文件 被 关闭 为 止 。 
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DSP 也 称 为 编 解码 器 ,实现 录音 和 放 音 ， 其 对 应 的 设备 文件 是 /dev/dsp 或 /dev/sound/dsp。OSS 
声卡 驱动 程序 提供 的 /dewdsp 是 用 于 数字 采样 和 数字 录音 的 设备 文件 ， 向 该 设备 写 数 据 即 意味 着 
激活 声卡 上 的 D/A 转换 器 进行 播放 , 而 向 该 设备 读数 据 则 意味 着 激活 声卡 上 的 A/D 转换 器 进行 





























































































































从 DSP 设备 读 取 数 据 时 ， 从 声卡 输入 的 模拟 信号 经 过 A/D 转换 器 变 成 数字 采样 后 的 样本 ， 
保存 在 声卡 驱动 程序 的 内 核 缓冲 区 : m ica T a 
在 内 核 缓冲 区 中 的 数字 采样 结果 将 被 复制 到 应 用 程序 所 指定 的 用 户 缓冲 区 中 。 如 果 应 用 程序 读 取 
数据 的 速度 过 慢 ， 以 致 低 于 声卡 的 采样 频率 ， 那 么 多 余 的 数据 将 会 被 丢弃 〈 即 overflow); 如 果 i 
取 数 据 的 速度 过 快 ， 以 致 高 于 声卡 的 采样 频率 ， 那 么 声卡 驱动 程序 将 会 阻塞 那些 请 求 数据 的 应 用 
程序 ， 直 到 新 的 数据 到 来 为 止 。 

向 DSP 设备 写 入 数据 时 ， 数 字 信 号 会 经 过 D/A 转换 器 变 成 模拟 信号 ， 然 后 产生 声音 。 应 用 程序 
写 入 数据 的 速度 应 该 至 少 等 于 声卡 的 采样 频率 , 过 慢 会 产生 声音 暂停 或 者 停顿 的 现象 ( 即 underflow). 
如 果 用 户 写 入 过 快 的 话 ， 它 会 被 内 核 中 的 声卡 驱动 程序 阻塞 ， 直 到 硬件 有 能 力 处 理 新 的 数据 为 止 。 

与 其 他 设备 有 所 不 同 ， 声 卡通 常 不 需要 支持 非 阻塞 (non-blocking) 的 LO 操作 。 即 便 内 核 
OSS 驱动 提供 了 非 阻 塞 的 IO 支持 ， 用 户 空间 也 很 少 采 用 。 
E 论 是 从 声卡 读 取 数 据 ， 或 是 向 声卡 写 入 数据 ， 事 实 上 都 具有 特定 的 格式 (format)， 如 无 符 
号 8 位、 单 声 道 、8kHz KEK, 如果 默 认 值 无 法 达到 要 求 ， 可 以 通过 ioct10 系 统 调用 来 改变 它们 。 
通常 说 来 ， 在 应 用 程序 中 打开 设备 文件 /dev/dsp 之 后 ， 接 下 去 就 应 该 为 其 设置 恰当 的 格式 ， 然 后 
才能 从 声卡 读 取 或 者 写 入 数据 。 


17.3.2 mixer 接口 
int register sound mixer(struct file operations *fops, int dev); 
上 述 函 数 用 于 注册 一 个 混 音 器 ， 第 一 个 参数 fops 即 是 文件 操作 接口 ， 第 二 个 参数 dev 是 设备 
编号 ， 如 果 填 入 -1， 则 系统 自动 分 配 一 个 设备 编号 。mixer 是 一 个 典型 的 字符 设备 ， 因 此 编码 的 
主要 工作 是 实 实现 file operations 中 的 open()、ioctl0 等 函数 。 
mixer 接口 file operations 中 的 最 重要 函数 是 ioctt0， 它 实现 混 音 器 的 不 同 UO 控制 
码 清单 17.1 所 示 为 一 个 ioctl0 的 范例 。 


代码 清单 17.1 mixer() 接 口 的 ioctl() 函 数 范 例 


1 static int mixdev ioctl(struct inode *inode, struct file *file, unsigned int cmd, 
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命令 ， 代 








unsigned long arg) 
2 A 


3 om 
4 switch (cmd) ( 

5 case SOUND MIXER READ MIC: 
6 

y 

8 


case SOUND MIXER WRITE MIC: 


9 case SOUND MIXER WRITE RECSRC: 


10 650 

LI case SOUND MIXER WRITE MUTE: 
T2 

DONE 
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14  /* Bdhar e */ 
le ectie i> sex (ool qud, arm 
i$. 3 


17.3.8 dsp 接口 

int register sound dsp(struct file operations *fops, int dev); 

上 述 函 数 与 register_sound_mixer() 类 似 ， 它 用 于 注册 一 个 dsp 设备 ， 第 一 个 参数 fops 即 是 
文件 操作 接口 ， 第 二 个 参数 dev 是 设备 编号 ， 如 果 填 入 -1， 则 系统 自动 分 配 一 个 设备 编号 。dsp 
也 是 一 个 典型 的 字符 设备 , 因此 编码 的 主要 工作 是 实现 file operations 中 的 read(). write(). ioctl() 
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dsp 接口 file operations 中 的 read() ll writeO 函 数 非 常 重要 ，read0 函 数 从 音频 控制 器 中 获取 
录音 数据 到 缓冲 区 并 复制 到 用 户 空间 ，write0 函 数 从 用 户 空 间 复制 音频 数据 到 内 核 空间 缓冲 区 
最 终 发 送 到 音频 控制 器 。 

dsp 接口 file operations 中 的 ioctlO 函 数 处 理 对 采样 率 、 量 化 精度 、DMA 绥 冲 区 块 大 小 等 参数 
设置 IO 控制 命令 的 处 理 。 
在 数据 从 缓冲 区 复制 到 音频 控制 器 的 过 程 中 ， 通 常会 使 用 DMA，DMA 对 声卡 而 言 非常 重要 。 
例如 , 在 放 音 时 , 驱动 设置 完 DMA 控制 器 的 源 数据 地 址 (内存 中 的 DMA 缓冲 区 )、 目 的 地 址 〈 音 
频 控制 器 FIFO) 和 DMA 的 数据 长 度 ，DMA 控制 器 会 自动 发 送 缓冲 区 的 数据 填充 FIFO， 直 到 发 
送 完 相应 的 数据 长 度 后 才 中 断 一 次 。 
在 OSS 驱动 中 ， 建 立 存放 音频 数据 的 环形 缓冲 区 (ring buffer) 通常 是 值得 推荐 的 方法 。 此 
外 ， 在 OSS 驱动 中 ， 一 般 会 将 一 个 较 大 的 DMA 缓冲 区 分 成 若干 个 大 小 相同 的 块 (这些 块 也 被 称 
Jj "Et", HJ fragment)， 驱 动 程序 使 用 DMA 每 次 在 声音 缓冲 区 和 声卡 之 间 搬 移 一 个 fragment. 
在 用 户 空 间 ， 可 以 使 用 ioctl0 系 统 调用 来 调整 块 的 大 小 和 个 数 。 
除了 read(). write() 8l ioctl() ^h, dsp 接口 的 poll0 函 数 通常 也 需要 被 实现 ， 以 向 用 户 反 馈 目 前 
能 否 读 写 DMA 缓冲 区 。 

在 OSS 驱动 初始 化 过 程 中 ， 会 调用 register sound dsp0 和 register_sound_mixer() 注 册 dsp 和 
mixer 设备 ， 在 模块 卸载 的 时 候 ， 会 调用 代码 清单 172. 


代码 清单 17.2. OSS 驱动 初始 化 注册 dsp 和 mixer 设备 

















































































































































































































































































































































































































































































































Statio int xxx (eel) 
( 


struct xxx state *s = &xxx state; 





if ((audio dev dsp = register sound dsp(&xxx audio fops, - 1)) < 0) 
GOTO ere gerile 
/* 设备 mixer 设备 */ 


9 if ((audio dev mixer = register sound mixer(&xxx mixer fops, - 1)) < 0) 


出 

2 

3 

4 det 

5 /* 注册 asp 设备 */ 
6 

7 

8 


10 goto err dev2; 

a 

JC ET 

LS 

14 void __exit xxx exit (void) 
19 d 
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16  /* 注销 dsp 和 mixer Wf m 
17  unregister sound dsp(audio dev dsp); 
18  unregister sound mixer (audio dev mixer); 


























根据 17.3.2. 和 17.3.3 小 节 的 分 析 ， 可 以 画 出 一 个 Linux OSS 驱动 结构 的 简 图 ， 如 图 17.4 
所 示 。 














file operations 








ioctl() 








read() write() | ioctl() poll() 




















17.4 Linux OSS 驱动 结 


17.84. OSS 用户 空间 编程 
1. dsp 编程 
对 OSS 驱动 声卡 的 编程 使 用 Linux 文件 接口 函数 ， 如 图 17.5 所 示 ，dsp 接口 的 操作 一 般 包 括 
如 下 几 个 步骤 。 























































































































































































































































































































(1) 打开 设备 文件 /dev/dsp。 SA 
采用 何 种 模式 对 声卡 进行 操作 也 必须 在 打开 设备 时 指定 ， 对 于 不 文 
持 全 双 工 的 声卡 来 说 ， 应 该 使 用 只 读 或 者 只 写 的 方式 打开 ， 只 有 那些 文 设置 缓冲 区 大 小 
持 全 双 工 的 声卡 ， 才 能 以 读 写 的 方式 打开 ， 这 还 依赖 于 驱动 程序 的 具体 
实现 。Linux 允许 应 用 程序 多 次 打开 或 者 关闭 与 声卡 对 应 的 设备 文件 ， 
从 而 能 够 很 方便 地 在 放 音 状态 和 录音 状态 之 间 进 行 切换 。 
(20 如 果 有 需要 ， 设 置 缓冲 区 大 小 。 读 /dewdsp 实现 录音 
运行 在 Linux 内 核 中 的 声卡 驱动 程序 专门 维护 了 一 个 缓冲 区 ， 其 大 写 Idevldsp 实现 播放 
































小 会 影响 到 播放 和 录音 时 的 效果 ， 使 用 ioctlO 系 统 调 用 可 以 对 它 的 尺寸 souci 
进行 恰当 设置 。 调 节 了 驱动 程序 中 缓冲 区 大 小 的 操作 不 是 必须 的 ， 如 果 没 
有 特殊 的 要 求 ， 一 般 采 用 默认 的 缓冲 区 大 小 也 就 可 以 了 。 如 果 想 设置 缓冲 区 的 大 小 ， 则 通常 应 紧 
跟 在 设备 文件 打开 之 后 ， 这 是 因为 对 声卡 的 其 他 操作 有 可 能 会 导致 驱动 程序 无 法 再 修改 其 缓冲 区 
的 大 小 。 
G) 设置 声 道 (channel) 数量 。 
根据 硬件 设备 和 驱动 程序 的 具体 情况 ， 可 以 设置 为 单 声 道 或 者 立体 声 。 
(4) 设置 采样 格式 和 采样 频率 
采样 格式 包括 AFMT U8 (无 符号 8 位 )、AFMT S8 (有 符号 8 位 )、AFMT _U16_LE〈 小 端 
模式 ， 无 符号 16 位 )、 ATN UIS BE (大 端 模式 ， 无 符号 1647). AFMT MPEG. AFMT AC3 
等 。 使 用 SNDCTL DSP SETFMT IO 控制 命令 可 以 设置 采样 格式 。 
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对 于 大 多 数 声卡 来 说 ， 其 支持 的 采样 频率 范围 一 般 为 SkHz-—44.1kHz 或 者 48kHz， 但 并 不 意 
味 着 该 范围 内 的 所 有 连续 频率 都 会 被 硬件 支持 ， 在 Linux 系统 下 进行 音频 编程 时 最 常用 到 的 几 种 
采样 频率 是 11025Hz、16000Hz、22050Hz、32000Hz 和 44100Hz。 使 用 SNDCTL DSP SPEED IO 
控制 命令 可 以 设置 采样 频率 。 

(5) 读 写 /dev/dsp 实现 播放 或 录音 。 

代码 清单 17.3 Cread, write, ioctl 的 出 错 处 理 没有 列 出 ) 的 程序 实现 了 利用 /dewdsp 接口 进行 
声音 录制 和 播放 的 过 程 ， 它 的 功能 是 先 录制 几 秒 钟 音频 数据 ， 将 其 存放 在 内 存 缓冲 区 中 ， 然 后 再 
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行 播放 。 
代码 清单 17.3 OSS dsp 接口 应 用 编程 范例 
dq. ductae D. 
2 #define LENGTH 3 /* 存储 秒 数 */ 
3 #define RATE 8000 /* 采样 频率 */ 
4 #define SIZE 8 /* 量化 位 数 */ 
5 #define CHANNELS 1 /* 声 道 数目 */ 
6 /* 用 于 保存 数字 音频 数据 的 内 存 缓冲 区 */ 
7 unsigned char buf[LENGTH TRRURCROSISROTOQOHANUNELS / SM 
8 int main() 
CE 
0 int fd; /* 声音 设备 的 文件 描述 符 */ 
1 int arg; /* 用 于 ioctl 调用 的 参数 */ 
2 int status; /* 系统 调用 的 返回 值 */ 
3 /* qA PG */ 
4 fd = open("/dev/dsp", O_RDWR); 
5 
6  /* 设置 采样 时 的 量化 位 数 */ 
7 Arg = SH 
8 status - ioctl(fd, SOUND PCM WRITE BITS, &arg); 
9 
20  /* 设置 采样 时 的 通道 数目 */ 
Z4 arg = CHANNELS; 
22 Status = ioctl(fd, SOUND PCM WRITE CHANNELS, &arg); 
29) 
24  /* 设置 采样 率 */ 
25 arg -» RATE; 
26 status = ioctl(fd, SOUND PCM WRITE RATE, &arg); 
Zu 
28  /* 循环 ， 直 到 按 下 [Ctrtfc] */ 
219 while (1) { 
30 printf("Say something: Mn"); 
31 status = read(fd, buf, sizeof(buf)); /* RE */ 
32 
213) pons dut E UBY COTES ato CH SEO 
34 Status = write(fd, buf, sizeof(buf)); /* HH */ 
319) 
36 /* 在 继续 录音 前 等 待 放 音 结束 */ 
3 Status ÉocLtltfd, SOUND POM SYNC, ED 
28 
Bo J 
40 } 
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2. mixer 编程 

声卡 上 的 混 音 器 由 多 个 混 音 通道 组 成 ， 它 们 本 
行 编程 。 对 混 音 器 的 操作 一 般 都 通过 ioctlO 系 统 调用 来 完成 ， 所 有 控 
或 者 MIXER 开头 ， 表 17.1 列 出 了 常用 的 混 音 器 控制 命令 。 
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以 通过 驱动 程序 提供 的 设备 文件 /dev/mixer 进 
制 命令 都 以 SOUND_MIXER 





































































































































































































































































































































































































表 17.1 混 音 器 常用 命令 
命 F E 
SOUND MIXER VOLUME 主音 量 调节 
SOUND MIXER BASS 低音 控制 
SOUND MIXER TREBLE 高 音 控制 
SOUND_MIXER_SYNTH FM 合成 器 
SOUND MIXER PCM E D/A 转换 器 
SOUND MIXER SPEAKER PC 喇叭 
SOUND MIXER LINE 音频 线 输入 
SOUND_MIXER_MIC 麦克 风 输 入 
SOUND MIXER CD CD 输入 
SOUND MIXER IMIX 放 音 音量 
SOUND MIXER ALTPCM 从 D/A 转换 器 
SOUND MIXER RECLEV 音 音量 
SOUND MIXER IGAIN 输入 增益 
SOUND MIXER OGAIN 输出 增益 
SOUND MIXER LINEI 声卡 的 第 1 输入 
SOUND MIXER LINE2 声卡 的 第 2 输入 
SOUND MIXER LINE3 声卡 的 第 3 输入 
对 声卡 的 输入 增益 和 输出 增益 进行 调节 是 混 音 器 的 一 个 主要 作用 ， 目 前 大 部 分 声卡 采用 的 是 
8 位 或 者 16 位 的 增益 控制 器 ， 声 卡 驱 动 程序 会 将 它们 变换 成 百分比 的 形式 ， 也 就 是 说 无 论 是 输入 
增益 还 是 输出 增益 ， 其 取 值 范围 都 是 从 0 一 100。 
(1) SOUND MIXER READ 宏 。 
在 进行 混 音 器 编程 时 ， 可 以 使 用 SOUND MIXER READ 宏 来 读 取 混 音 通道 的 增益 大 小 ， 例 
如 ， 如 下 代码 可 以 获得 麦克 风 的 输入 增益 : 
ioctl(fd, SOUND MIXER READ(SOUND MIXER MIC), &vol); 
对 于 只 有 一 个 混 音 通道 的 单 声 道 设备 来 说 ， 返 回 的 增益 大 小 保存 在 低位 字 节 中 。 而 对 于 支持 
多 个 混 音 通道 e 道 设备 来 说 ， 返 回 的 增益 大 小 实际 上 包括 两 个 部 分 ， 分 别 代表 左 、 右 两 个 声 
道 的 值 ， 其 中 低位 字 节 保存 左 声 道 的 音量 ， 而 高 位 字 节 则 保存 右 声 道 的 音量 。 下 面 的 代码 可 以 从 
返回 值 中 依次 提取 左右 声 道 的 增益 大 小 : 
int left, right; 
left - vol & Oxff; 
right = (vol & Oxff00) »» 8; 
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(2) SOUND MIXER WRITE 宏 。 
如 果 想 设置 混 音 通道 的 增益 大 小 ， 则 可 以 通过 SOUND_MIXER_WRITE 宏 来 实现 , 例如 下 面 
的 语句 可 以 用 来 设置 麦克 风 的 输入 增益 : 


OU (Le «s S le 
ioctl(fd, SOUND MIXER WRITE (SOUND MIXER MIC), &vol); 


(3) 查询 MIXER 信息 。 
声卡 驱动 程序 提供 了 多 个 ioctl0 系 统 调用 来 获得 混 音 器 的 信息 ， 它 们 通常 返回 一 个 整 型 的 位 
掩 码 ， 其 中 每 一 位 分 别 代表 一 个 特定 的 混 音 通道 ， 如 果 相 应 的 位 为 1， 则 说 明 与 之 对 应 的 混 音 通 
道 是 可 用 的 。 
通过 SOUND_MIXER_READ_DEVMASK 返回 的 位 掩 码 查 询 出 能 够 被 声卡 支持 的 每 一 个 泥 
音 通 道 ， 而 通过 SOUND MIXER READ RECMAS 返回 的 位 掩 码 则 可 以 查询 出 能 够 被 当 作 录 音源 
的 每 一 个 通道 。 例 如 ， 如 下 代码 可 用 来 检查 CD 输入 是 否 是 一 个 有 效 的 混 音 通 道 ; 
ioctl(fd, SOUND MIXER READ DEVMASK, &devmask); 


if (devmask & SOUND MIXER CD) 
printf("The CD input is supported"); 
如 下 代码 可 用 来 检查 CD 输入 是 否 是 一 个 有 效 的 录音 源 : 
ioctl(fd, SOUND MIXER READ RECMASK, &recmask); 


if (recmask & SOUND MIXER CD) 
printf("The CD input can be a recording source"); 


大 多 数 声卡 提供 了 多 个 录音 源 , 通过 SOUND MIXER READ RECSRC 可 以 查询 出 当前 正在 
使 用 的 录音 源 ， 同 一 时 刻 可 使 用 两 个 或 两 个 以 上 的 录音 源 ， 具 体 由 声卡 硬件 本 身 决定 。 相 应 地 ， 
使 用 SOUND MIXER WRITE RECSRC 可 以 设置 声卡 当前 使 用 的 录音 源 ， 如 下 代码 可 以 将 CD 
输入 作为 声卡 的 录音 源 使 用 。 


devmask = SOUND MIXER CD; 
ioctl(fd, SOUND MIXER WRITE RECSRC, &devmask); 
此 外 ， 所 有 的 混 音 通道 都 有 单 声 道 和 双 声 道 的 区 别 ， 如 果 需 要 知道 哪些 混 音 通道 提供 了 对 立 
体 声 的 支持 ， 可 以 通过 SOUND MIXER READ STEREODEVS 来 获得 。 
代码 清单 17.4 的 程序 实现 了 利用 /dev/mixer 接口 对 混 音 器 进行 编程 的 过 程 ， 该 程序 


混 音 通道 的 增益 进行 调节 。 


oo 
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代码 清单 17.4 OSS mixer 接口 应 用 编程 范例 
finclude ... 
2 /* 用 来 存储 所 有 可 用 混 音 设备 的 名 称 */ 
3 const char *sound device names[] = SOUND DEVICE NAMES; 
4 int fd; /* 混 音 设备 所 对 应 的 文件 描述 符 */ 
5 int devmask, stereodevs; /* 混 音 器 信息 对 应 的 bit I */ 
6 
7 
8 
































char *name; 
/* 显示 命令 的 使 用 方法 及 所 有 可 用 的 混 音 设备 / 


void usage() 



































ONE 

d) . ime 3p 

wi fprintf (stderr, "usage: $s «device» <left-gain%%> <right-gain%%>\n" 

32 "És «device» «gain£e$»XnWMn""Where «device» is one of:Mn", name, name); 
IS for(i —» 0; i « SOUND MIXER NRDEVICES; i--) 

14 if ((1 «« i) &devmask) 


15 — /* 只 显示 有 效 的 混 音 设备 */ 
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16 fprintf(stderr, "$s ", sound device names[i]); 
Ay) fprintfisbderr, ANAW), 
19 eed 
19r 
20 
2 ame menimme ancen Ces CR BIB) 
225 
23 int left, right, level; /* JmwuH */ 
24 int status; /* 系统 调用 的 返回 值 */ 
25 int device; /* 选用 的 混 音 设备 */ 
26 char *dev; /* 混 音 设备 的 名 称 */ 
Ah NEE S 
28 name = argv[0]; 
29  /* 以 只 读 方 式 打开 混 音 设备 */ 
30 fd = open("/dev/mixer", O RDONLY); 
SH Af Qfgoe— € 
32 perror("unable to open /dev/mixer"); 
33 exit (1); 
34 } 
35 
36  /* 获得 所 需要 的 信息 */ 
S Status = ioctl(fd, SOUND MIXER READ DEVMASK, &devmask); 
38 if (status == - 1) 
39 perror("SOUND MIXER READ DEVMASK ioctl failed"); 
40 Status = ioctl(fd, SOUND MIXER READ STEREODEVS, &stereodevs); 
41 If (status == 1) 
42 perror("SOUND MIXER READ STEREODEVS ioctl failed"); 
43  /* 检查 用 户 输入 */ 
44 if (argo !— 3 && argo l9 4) 
45 usage (); 
46  /* 保存 用 户 输入 的 混 音 器 名 称 */ 
47 dev = argv[1]: 
48 /* 确定 即将 用 到 的 混 音 设备 */ 
49 for qi. 07 1 € SOUND MIXER NRDEVICES? 1-4-) 
50 if (((1 << i) &devmask) && !strcmp(dev, sound device names[i])) 
51 break; 
52 if (i == SOUND MIXER NRDEVICES) { 
53 /* 没有 找到 匹配 项 */ 
54 fprintf(stderr, "$s is not a valid mixer deviceWMn", dev); 
56 usage(); 
56 } 
57  /* 查找 到 有 效 的 混 音 设备 */ 
58 device = i; 
59  /* 获取 增益 值 */ 
60 if (argc == 4) ( 
61 /* 左 、 右 声 道 均 给 定 */ 
62 left - atoi(argv[2]); 
63 right - atoi(argv[3]); 
$4 F else ij 
65 /* 左 、 右 声 道 设 为 相等 */ 
66 left S atoi(argv[2]); 
67 right - atoi(argv[2]); 
68 } 
69 
70 /* 对 非 立 体 声 设备 给 出 警告 信息 */ 
398 IINUX, 
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if ((left != right) && !((1 << i) &stereodevs)) 
fprintf(stderr, "warning: $s is not a stereo deviceWMn", dev); 
/* 将 两 个 声 道 的 值 合 到 同一 变量 中 */ 
level = (right << 8) + left; 
/* 设置 增益 */ 
Status = ioctl(fd, MIXER WRITE(device), &level); 
if (status == - 1) { 
perror("MIXER WRITE ioctl failed"); 
exit(1); 
] 
/* 获得 从 驱动 返回 的 左右 声 道 的 增益 */ 
left = level &Oxff; 
right = (level &0Oxff00) >> 8; 
/* 显示 实际 设置 的 增益 */ 
fprintf(stderr, "$s gain set to $d$$ / $d$$2WXn", dev, left, right); 
/* 关闭 混 音 设备 */ 
close(fd); 
return 0; 
j 
上 述 程序 为 可 执行 文件 mixer, SAT /mixer «device» <left-gain%> <right-gain%> 或 ./mixer 


M 
2 


«device» <gain%> 可 设置 增益 ，device 可 以 是 vol, pem, speaker, line, mic. cd. igain, linel, 


phin, video. 
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17.4.1 











基本 
好 弥 
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ALSA 的 


虽然 OSS 已 经 非常 成 熟 ， 但 它 毕 竟 是 
上 在 Linux mainline 中 失去 了 更 新 。 而 ALSA 
， 它 符合 GPL， 是 在 Linux 下 进 











这 一 空 








组 成 



































个 没有 完全 开放 源 代码 的 商业 产品 ， 而 且 目 前 
(Advanced Linux Sound Architecture) 恰 


音频 编程 时 另 一 种 可 供 选择 的 声卡 驱动 
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体系 结构 。ALSA 除了 像 OSS 那样 提供 了 一 组 内 核 驱 动 程序 模块 之 外 ， 还 专门 为 简化 应 用 



















































































































































































程序 的 编写 提供 了 相应 的 函数 库 ， 与 OSS 提供 的 基于 ioctl 的 原始 编程 接口 相 比 ，ALSA FR 
数 库 使 用 起 来 要 更 加 方便 一 些 。ALSA 的 主要 特点 如 下 。 

e 支持 多 种 声卡 设备 。 

e 模块 化 的 内 核 驱动 程序 。 

@ 支持 SMP 和 多 线程 。 

e 提供 应 用 开发 函数 库 (alsa-lib) 以 简化 应 用 程序 开发 。 

e 支持 OSS API， 兼 容 OSS 应 用 程序 。 

ALSA 且 完 全 兼容 于 OSS， 对 应 用 程序 员 来 讲 无 疑 是 一 个 更 


的 选 






































L& alsa-utils, # 














有 更 加 友好 的 编程 接口 ， 
择 。ALSA Aa diui 
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J& alsa-driver、 开 发 包 alsa-libs. FEEF alsa-libplugins、 设 置 


























他 声音 相关 处 理 
































E 
小 程序 包 alsa-tools、 特 殊 音 频 固件 支持 包 alsa- firmware. 
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OSS 接口 兼容 模拟 层 工具 alsa-oss 共 7 个子 项 目 ， 其 中 只 有 驱动 包 是 必需 的 。 

alsa-driver 指 内 核 驱 动 程序 ， 包 括 人 硬件 相关 的 代码 和 一 些 公 共 代 码 ， 非 常 庞 大 ， 代 码 总 量 达 
数 十 万 行 ; alsa-libs 指 用 户 空间 的 函数 库 ， 提 供给 应 用 程序 使 用 ， 应 用 程序 应 包含 头 文件 
asoundlib.h， 并 使 用 共享 库 libasound.so; alsa-utils 包含 一 些 基于 ALSA 的 用 于 控制 声卡 的 应 用 程 
序 ， 如 alsaconf〈 侦 测 系统 中 声卡 并 写 一 个 适合 的 ALSA 配置 文件 )、alsactl( 控 制 ALSA 声卡 驱 
动 的 高 级 设置 ) alsamixer( 基 于 ncurses 的 温 音 器 程序 )、amidi( 用 于 读 写 ALSA RawMIDI) amixer 
CALSA 声卡 温 音 器 的 命令 行 控制 )、aplay (基于 命令 行 的 声音 文件 播放 )、arecord (基于 命令 行 
的 声音 文件 录制 ) 等。 
目前 ALSA 内 核 提 供给 用 户 空 间 的 接口 有 : 
e 信息 接口 Information Interface, /proc/asound); 
e 控制 接口 〈Control Interface, /dev/snd/controICX); 
e 混 音 器 接口 (Mixer Interface, /dev/snd/mixerCXDX); 
e 


PCM 接口 (PCM Interface, /dev/snd/pcem Oss 应 用 上 Oss 应 用 ALSA 应 用 
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CXDX ); 
€ Raw 迷 笛 接口 (Raw MIDI Interface, /dev/ 
OSS API o 
snd/midiCXDX); ALSA 库 API 
e 音 序 器 接口 (Sequencer Interface, /dev/snd/ ALSA 库 
seq); 硬件 访问 
、 H , OSS 用 户 
© 定时 器 接口 (Timer Interface, /dev/snd/ 空间 模拟 
i 插件 〈Conversion， 
timer). routing ) 
EORR d a E E E OSS API ALSA 内 核 API (PCM/ 
提 供 ,不同 的 是 这 些 接 口 被 提 供给 alsa-lib 使 js MIDI/Control/ Sequencer 































































































而 不 是 直接 给 应 用 程序 使 用 的 。 应 用 程序 最 好 使 OSS 模 拟 | 
用 alsa-lib， 或 者 更 高 级 的 接口 ， 比 如 jack 提供 ^e 2 
的 接口 。 硬件 

图 17.6 所 示 为 ALSA 声卡 驱动 与 用 户 空 间 体系 
结构 的 简 图 ， 从 中 可 以 看 出 ALSA 内 核 驱动 与 用 户 l 
空间 库 及 OSS 之 间 的 关系 。 


17.4.2. card 和 组 件 管理 

对 于 每 个 声卡 而 言 ， 必 须 创 建 一 个 card 实例 。card 是 声卡 的 “总 部 ” 它 管理 这 个 声卡 上 的 
所 有 设备 (组 件 )， 如 PCM、mixers、MIDI、synthesizer 等 。 因 此 ，card 和 组 件 是 ALSA 声卡 驱 
动 中 的 主要 组 成 元 素 。 

1. 创建 card 


struct snd card *snd card new(int idx, const char *xid, 
































































































































struct module *module, int extra size); 
idx 是 card 索引 号 ，xid 是 标识 字符 串 ，module 一 般 为 THIS MODULE. extra size 是 要 分 配 
的 额外 数据 的 大 小 ， 分 配 的 extra_size 大 小 的 内 存 将 作为 card->private_data。 
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2. 创建 组 件 


int snd device new(struct snd card *card, snd device type t type, 


oo 


void *device data, struct snd device ops *ops); 


1 card 被 创建 后 ， 设 备 〈 组 件 ) 能 够 被 创建 并 关联 于 该 card. 98 1 个 参数 是 snd card new() 
创建 的 card 指针 , 第 2 个 参数 type 指 的 是 device-level 即 设备 类 型 , 形式 为 SNDRV_DEV_XXX， 
包括 SNDRV DEV CODEC, SNDRV. DEV CONTROL, SNDRV DEV PCM. SNDRV. DEV_ 
RAWMIDI 等 ， 用 户 自 定义 设备 的 device-level 是 SNDRV_DEV_LOWLEVEL，ops 参数 是 1 个 函 
数 集 (定义 为 snd_device_ ops 结构 体 ) 的 指针 ，device_data 是 设备 数据 指针 ， 注 意 函 数 snd device - 
new0O 本 身 不 会 分 配 设 备 数据 的 内 存 ， 因 此 应 事先 分 配 。 

3. 组 件 释 放 

每 个 ALSA 预定 义 的 组 件 在 构造 时 需 调用 snd_device new0， 而 每 个 组 件 的 析 构 方法 则 在 函数 集中 
被 包含 。 对 于 PCM、AC97 此 类 预定 义 组 件 ， 我 们 不 需 关 心 它 们 的 析 构 ， 而 对 于 自 定义 的 组 件 ， 则 需要 
填充 snd device ops 中 的 析 构 函数 指针 dev_free， 这 样 ， 当 snd card _ freeO 被 调用 时 ， 组 件 将 
动 被 释放 。 

4. 芯片 特定 的 数据 (Chip-Specific Data) 

芯片 特定 的 数据 一 般 以 struct xxxchip 结构 体形 式 组 织 ， 这 个 结构 体 中 包含 芯片 相关 的 VO 端 
口 地 址 、 资 源 指针 、 中 断 号 等 ， 其 意义 等 同 于 字符 设备 驱动 中 的 fle->private_data。 
定义 芯片 特定 的 数据 主要 有 两 种 方法 ,一 种 方法 是 将 sizeof(struet xxxchip) 传 入 snd_card_new() 
/EJJ extra size 参数 ， 它 将 自动 成 为 snd_card 的 private data 成 员 ， 如 代码 清单 17.5 所 示 ; 男 一 种 
方法 是 在 snd_card_new() 传 入 给 extra size 参数 0， 再 分 配 sizeof(struct xxxchip) 的 内 存 ， 将 分 配 内 
存 的 地 址 传 入 snd device new0 的 device data 的 参数 ， 如 代码 清单 17.6 所 示 。 


代码 清单 17.5 ”创建 芯片 特定 的 数据 方法 1 
struct xxxchip (/* 芯片 特定 的 数据 结构 体 */ 








lE 






































































































































































































































































































































}; 

card = snd card new(index, id, THIS MODULE, sizeof(struct 
xxxchip)); /* 创建 声卡 并 申请 xxxchip 内 存 作为 card-» private data */ 
struct xxxchip *chip = card-»private data; 


代码 清单 17.6 ”创建 芯片 特定 的 数据 方法 2 























人 


























1 struct snd card ‘card: 

2. EO So Es 

3 /* 使 用 0 作为 第 4 个 参数 ， 并 动态 分 配 xxx chip 的 内 存 */ 
4 card = snd card new(index[dev], id[dev], THIS MODULE, 0); 
ON ME 

6 chip = kzalloc(sizeof(*chip), GFP KERNEL); 

7 /* f£ xxxchip 结构 体 中 ， 应 该 包括 声卡 指针 */ 

S) ger eh 

9 Siem CEN Sac ad Ned Cir 

3L) 

11 j; 

















12 /* 并 将 其 cara 成 员 赋值 为 snd card new () 创建 的 cara 指针 */ 
13 chipr»card - cards 





14 static struct snd device ops ops = { 
15  . dev free = snd xxx chip dev free, /* 组 件 析 构 */ 
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Tom 











18 /* 创建 自 定义 组 件 */ 
19 snd device new(card, SNDRV DEV LOWLEVEL, chip, &ops); 

20 /* 在 析 构 函数 中 释放 xxxchip 内 存 */ 

21 static int snd xxx chip dev free(struct snd device *device) 

2/2101 

23 return snd xxx chip free(device-»device data); /* 释放 */ 

24 ] 

5. 注册 /释放 声卡 

当 snd card 被 准备 好 以 后 ， 可 使 用 snd card register() 函 数 注 册 这 个 声卡 ， 
int snd card register(struct snd card *card) 

对 应 的 snd_card_free0 完 成 相反 的 功能 ， 如 下 所 示 : 


int snd card free(struct snd card *card); 


17.4.8 PCM 设备 

每 个 声卡 最 多 可 以 有 4 个 PCM 实例 ， 一 个 PCM 实例 对 应 一 个 设备 文件 。PCM 实例 由 PCM 
播放 和 录音 流 组 成 ， 而 每 个 PCM 流 又 由 一 个 或 多 个 PCM 子 流 组 成 。 有 的 声卡 支持 多 重播 放 功能 ， 
例如 ，emul0k1l 包含 一 个 有 32 个 立体 声 子 流 的 PCM 播放 设备 。 

1. PCM 实例 构造 


int snd pcm new(struct snd card *card, char *id, int device, 



































如 下 所 示 : 


7i 

























































































int playback count, int capture count, struct snd pcm ** rpcm); 


第 1 个 参数 是 card 指针 ， 第 2 个 是 标识 字符 串 ， 第 3 个 是 PCM 设备 索引 〈0 表示 第 1 个 PCM 
设备 )， 第 4 和 第 5 个 分 别 为 播放 和 录音 设备 的 子 流 数 。 当 存在 多 个 子 流 时 ， 需 要 恰当 地 处 理 open(). 
close0 和 其 他 函数 。 在 每 个 回调 函数 中 ， 可 以 通过 snd pcm_substream 的 number 成 员 得 知 目前 操 
作 的 究竟 是 哪个 子 流 ， 如 下 所 示 : 


struct snd pcm substream *substream; 


























































































































int index = substream-»number; 
一 种 习惯 的 做 法 是 在 驱动 中 定义 一 个 PCM “构造 函数 ” 负责 PCM 实例 的 创建 ,如 代码 清单 17.7 
Bras. 





























代码 清单 17.7 PCM 设备 的 “构造 函数 ” 
1 static int | devinit snd xxxchip new pcom(struct xxxchip *chip) 
Z 1 
3 struct snd pcm pom 
4 TEREE, 
5  /* 创建 PCM 实例 * 
6 
7 
8 





t (Qne sand pon newleohipesccard, "xxs Ohip t D. Lye pom) € 5) 
return err; 
pcm-»private data = chip; /* É pcm-»private data 为 世 片 特定 数据 */ 
g strcpy(pcm-»name, "xxx Chip"); 
10 chip-»pcm -» poem; 


12 return 0; 
Xs 


2. i$ E PCM 操作 


void snd pcm set ops(struct snd pcm *pcm, int direction, struct snd pcm ops *ops); 
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oe 


第 1 个 参数 是 snd pem 的 指针 ， 第 2 个 参数 是 SNDRV PCM STREAM PLAYBACK 或 SNDRV - 
PCM STREAM CAPTURE， 而 第 3 个 参数 是 PCM 操作 结构 体 snd pem ops， 这 个 结构 体 的 定义 


如 代码 清单 17.8 所 示 。 

















dH 

















代码 清单 17.8 snd pcm ops 结构 体 


Struct desm(el joxchu (oJeyst i 
2 int (*open) (struct snd pcm substream *substream); 
3 int (*close) (struct snd pcm substream *substream); 





int (*ioctl) (struct snd pcm substream * substream, 
unsigned int cmd, void *arg); 
int (*hw params) (struct snd pcm substream *substream, 


int (*hw free) (struct snd pcm substream *substream); /* 资源 释放 */ 
int (*prepare) (struct snd pcm substream *substream); 
0 /* 在 PCM 被 开始 、 停 止 或 暂停 时 调用 */ 
1 int (*trigger) (struct snd pcm substream *substream, int cmd); 
2 snd pcm uframes t (*pointer) (struct snd pcm substream *substream);/ * 当前 缓冲 区 的 
硬件 位 置 */ 
3 /* 缓冲 区 复制 */ 


4 int (*copy) (struct snd pcm substream *substream, int channel, 


3) 
6 
也 struct snd pcm hw params *params); 
8 
9 









































snd pcm uframes t pos, 


5 

6 void meer *buf, snd pcm uframes t count); 

7 int (*silence) (struct snd pcm substream *substream, int channel, 
8 


snd pom uframes t pos, snd pem uframes t count); 





9 struct page * (*page) (struct snd pcm substream *substream, 

20 unsigned long offset); 

21 int (*mmap) (struct snd pcm substream *substream, struct vm area struct *vma); 
22 int (*ack) (struct snd pcm substream *substream); 

DONDE 


snd pem ops 中 的 所 有 操作 都 需 事先 通过 snd pem substream chip() 获 得 xxxchip 指针 ， 
例如 : 


IOE ERALA 


{ 









































struct xxxchip *chip = snd pcm_substream_chip (substream); 




















du 
ms 

















} 
当 一 个 PCM 子 流 被 打开 时 ，snd_pcm_ ops 中 的 open0 函 数 将 被 调 E 这 个 函数 中 ， 至 少 需 


9] 1545 runtime->hw 字段 ， 代 码 清单 17.9 所 示 为 open0 函 数 的 范例 。 


代码 清单 17.9 snd pcm ops 结构 体 中 的 open() 函 数 








58 
E 

















1 static int snd xxx open(struct snd pcm substream *substream) 
NEN 

3 /* 从 子 流 获得 xxxchip 指针 */ 

4 struct xxxchip *chip = snd pcm substream chip (substream); 
5 — /* 获得 PCM 运行 时 信息 指针 */ 

6 struct snd pcm runtime *runtime = substream->runtime; 

7 E 

8 /* 初始 化 runtime->hw */ 

9 runtime-»hw = snd xxxchip playback hw; 

10 return 0; 

3E 
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上 述 代码 : 















































的 snd xxxchip playback hw 
段 私 有 数据 。 如 果 硬 件 配置 需要 更 多 的 限制 ， 
当 PCM 子 流 被 关闭 时 ，close0 函 数 将 被 调用 。 



























































是 预先 定义 的 硬件 描述 。 在 open0 函 数 中 ， 可 以 分 配 
也 需 设 置 硬件 限制 。 
如 果 open0 函 数 中 分 配 了 私有 数据 ， 则 在 close) 








函数 中 应 该 释放 substream 的 私有 数据 ， 代 三 清 单 17.10 所 示 为 close0 函 数 的 范例 。 
代码 清单 17.10 snd pcm ops 结构 体 中 的 close() 函 


缓冲 区 大 小 条 
Static int snd xxx hw params(struct snd pcm substream *substream,struct snd pcm hw params 
*hw params); 


在 这 个 函数 中 ， 将 完成 大 量 硬件 设置 ， 甚 


调 


P 


























static int snd xxx close(struct snd pcm substream *substream) 


kfree(substream-»runtime-»private data); 


1 
2 
3 /* 释放 子 流 私 有 数据 */ 
4 














驱动 中 通常 可 以 给 snd pem ops 的 ioct0 成 员 函 数 传递 通 
函数 将 在 应 
， 它 的 


snd pcm ops 的 hw_params() 成 员 函 
上 格式 等 ) 的 时 候 被 调 

















au 


















































程序 设置 硬 伯 



































ZIRAN 




















snd pcm lib malloc_pages (substream, 
X“ DMA RIX CRY 
与 hw_params() 对 应 的 函数 是 hw_free()， 

































































snd pcm lib free pages (substream); 





当 PCM 被 “准备 ”时 ，prepare() 函 数 将 被 调用 ， 
数 与 hw_params0) 函 数 的 不 同 在 于 对 prepare() 的 调 








候 。prepareO 的 形式 如 下 : 





static int snd xxx prepare(struct snd pom su 


先 分 配 的 情况 下 ， 





至 包括 缓冲 


上 述 调 月 




















它 释 放 














释放 snd pcm lib malloc pagesOZEP [X : 




















区 分 配 ， 这 时 可 调用 如 下 
params buffer bytes (hw params)); 
日 才 可 成 立 。 

由 hw_params() 分 配 的 资源 ， 例 如 ， 

















nd 
Ft 
II 















































bstream *substream); 








trigger0 成 员 函 数 在 PCM 被 开始 、 


停止 或 暂停 时 调用 ， 




















函数 的 形式 如 下 ; 


的 snd pem lib ioctlO 函 数 。 
F 参 数 (PCM 子 流 的 周期 大 小 、 














it E ER C: 








通过 如 下 


可 以 设置 采样 率 、 格 式 等 。prepare() 
Æ snd_pcm_prepare() 每 次 被 调用 的 时 





static int snd xxx trigger(struct snd pcm substream *substream, int cmd); 











cmd 参数 定义 了 














HARJIT, Æ trigger) n K 


START 和 SNDRV PCM TRIGGER STOP 命令 ， 如 


起 


TRIGGER RESUME 


所 














/恢复 ， 当 能 量 





管理 状态 发 生 
































示 为 trigger() 函 数 的 范例 。 
代码 清单 17.11 


{ 
switch (cmd) ( 
case SNDRV PCM TRIGGER START: 
/* 开启 PCM 引擎 */ 
break; 
case SNDRV PCM TRIGGER STOP: 
/* 停止 PCM 引擎 */ 


QD CI Oy, cU A 





snd pcm ops 








数 ! 





至 少 要 处 





























六 SNDRV PCM TRIGGER . 














ZR 


PCM 支持 暂停 ， 
TRIGGER PAUSE PUSH 和 SNDRV PCM TRIGGER PAUSE RELEASE 命令 。 




















结构 体 中 的 trigger) e 3 


static int snd xxx trigger(struct snd pcm substream *substream, int cmd) 











民 。 代 码 


还 应 处 理 SNDRV_PCM_ 





如 果 设 备 支 持 挂 





变化 时 将 处 理 SNDRV PCM TRIGGER SUSPEND 和 SNDRV_PCM_ 
这 两 个 命令 。 注 意 trigger() 函 数 是 原子 的 ， 中 途 不 能 睡 有 

















17.11 
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9 break; 

10 /* 其 他 命令 */ 

ALL default: 

32 return - EINVAL; 
L3 } 

14 } 


























pointer) K AHF PCM 中 间 层 查询 目前 缓冲 区 的 硬件 位 置 ， 该 函数 以 帧 的 形式 返回 0 一 
buffer size — 1 的 位 置 (ALSA 0.5.x 中 为 字 节 形式 )， 此 函数 也 是 原子 的 。 

copy0 和 silence0 函 数 一 般 可 以 省 略 ， 但 是 ， 当 硬件 缓冲 区 不 处 于 常规 内 存 中 时 需要 。 例 如 ， 
一 些 设备 有 自己 的 不 能 被 映射 的 硬件 缓冲 区 ， 这 种 情况 下 ， 我 们 不 得 不 将 数据 从 内 存 缓冲 区 复 和 
到 硬件 缓冲 区 。 当 内 存 缓冲 区 在 物理 和 虚拟 地 址 上 都 不 连续 时 ， 这 两 个 函数 也 必须 被 实现 。 

3. 分 配 缓 冲 区 

分 配 缓冲 区 的 最 简单 方法 是 调用 如 下 函数 : 


int snd pcm lib preallocate pages for all(struct snd pom *pcm, 








































































































pen 
pa 




























































































int type, void *data, size t size, size t max); 
type 参数 是 缓冲 区 的 类 型 , 包含 SNDRV_DMA TYPE UNKNOWN (未 知 )、SNDRV_DMA 
TYPE CONTINUOUS (连续 的 非 DMA 内 存 )、SNDRV_DMA TYPE DEV (连续 的 通用 设备 )， 
SNDRV DMA TYPE _DEV_SG( 通 用 设备 SG-buffer) 和 SNDRV_DMA TYPE SBUS( 连 续 的 SBUS )。 
如 下 代码 将 分 配 64KB 的 缓冲 区 : 


snd pcm lib preallocate pages for all(pcm, SNDRV DMA TYPE DEV, 
snd dma pci data(chip-»pci),64*1024, 64*1024); 


4. 设置 标志 

在 构造 PCM 实例、 设置 操作 集 并 分 配 缓冲 区 之 后 ， 如 果 有 和 需要， 应 设置 PCM 的 信息 标志 ， 
例如 ， 如 果 PCM 设备 只 支持 半 双 工 ， 则 这 样 定义 标志 : 

pcm-»info flags = SNDRV PCM INFO HALF DUPLEX; 

5. PCM 实例 析 构 

PCM 实例 的 “ 析 构 函数 ”并 非 是 必须 的 ， 因 为 PCM 实例 会 被 PCM 中 间 层 代码 自动 释放 ， 
如 果 驱 动 中 分 配 了 一 些 特别 的 内 存 空间 ， 则 必须 定义 “ 析 构 函数 ”代码 清单 17.12 所 示 为 PCM 
“ 析 构 函数 ”与 对 应 的 “构造 函数 ”,“ 析 构 函 数 ” 会 释放 “构造 函数 ”中 创建 的 xxx private pem data. 


代码 清单 17.12. PCM 设备 “ 析 构 函数 ” 
static void xxxchip pcm free(struct snd pcm *pocm) 
{ 











































































































































































































1 

2 

3 /* 从 pem 实例 得 到 chip */ 

4 struct xxxchip *chip - snd pcm chip (pom); 
5  /* 释放 自 定义 用 途 的 内 存 */ 
6 

7 

8 
































kfree(chip-»xxx private pcm data); 


) 

















$i 

10 static int —|devinit snd xxxchip new pcm(struct xxxchip *chip) 
33b 4i 

12 struct snd pcm *pcm; 

1.9 ad 

14 /* 分 配 自 定义 用 途 的 内 存 */ 

la Ghip-exxxc private pomodata — knalibc ChE 
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16 pom-»private data - chip; 

iy /* 设置 “ 析 构 函数 ” */ 

18 pom-»private free = xxxchip pcm free; 
19 

20 ] 











上 述 代码 第 4 行 的 snd pem chip0/A PCM 实例 指针 获得 xxxchip 指针 ， 实 际 上 它 就 是 返回 第 
16 行 给 PCM 实例 赋予 的 xxxchip 指针 。 

6. PCM 信息 运行 时 结构 体 

当 PCM 子 流 被 打开 后 , PCM 运行 时 实例 (定义 为 结构 体 snd pem runtime, 如 代码 清单 17.13 
所 示 ) 将 被 分 配给 这 个 子 流 ， 这 个 指针 通过 substream->runtime 获得 。 运 行 时 指针 包含 各 种 各 样 
的 信息 : hw params 及 sw params 配置 的 拷贝 、 缓 冲 区 指针 、mmap 记录 、 自 旋 锁 等 ， 几 乎 PCM 
的 所 有 控制 信息 均 能 从 中 取得 。 


代码 清单 17.13 ”snd_pcm_runtime 结构 体 


struct snd pem runtime 1 


[* ARAS */ 










































































1 

2 

3 struct snd pcm substream *trigger master; 

4 snd timestamp t trigger tstamp; /* 触发 时 间 戳 */ 

5 int overrange; 

6 snd pcm uframes t avail max; 

y snd pcm uframes t hw ptr base; /* 缓冲 区 复位 时 的 位 置 */ 
8 snd pcm uframes t hw ptr interrupt; /* 中 断 时 的 位 置 */ 
9 /* 硬件 参数 */ 
















































































0 snd pcm access t access; /* 存 取 模式 */ 

1  snd pem format t format; /* SNDRV PCM FORMAT * */ 
2  snd pcm subformat t subformat; /* fA4&X */ 

3 unsigned int rate; /* rate in Hz */ 

4 unsigned int channels; /* MEE */ 

5 snd pcm uframes t period size; /* 周期 大 小 */ 

6 unsigned int periods; /* 周期 数 */ 

7 snd pcm uframes t buffer size; /* 缓冲 区 大 小 */ 
SEEEnSugnedEunesenclemc e Je Cro Cime y 

9 snd pcm uframes t min align; /* 格式 对 应 的 最 小 对 齐 */ 
20 size_t byte_align; 

21 unsigned int frame_bits; 

22 unsigned int sample_bits; 

239 unsigned mie. MEGF 

24 unsigned int rate num; 

25 unsigned int rate den; 

26  /* 软件 参数 */ 

27 struct timespec tstamp mode; /* mmap 时 间 惟 被 更 新 */ 
28 unsigned int period step; 

29 unsigned int sleep min; /* 睡眠 的 最 小 节拍 */ 

30 snd pcm uframes t xfer align; 

A snd pom uframes t start threshold; 

Ex snd pcm uframes t stop threshold; 

33  snd pcm uframes t silence threshold; /* Silence JH75BU[H */ 
34 snd pcm uframes t silence size; /* Silence JR7bA/ */ 
35  snd pcm uframes t boundary; 

36 snd pcm uframes t silenced start; 

ET snd pcm uframes t silenced size; 
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38 snd pcm sync id t sync; /* 硬件 同步 ID */ 


ale 


























S39. E wee 

40 volatile struct snd pcm mmap status *status; 

41 volatile struct snd pcm mmap control *control; 

242  atonrc-t nm count: 

43  /* 锁 / 调 度 */ 

44 SpunicockUe ois 

45 wait queue head t sleep; 

4j.  ehtxew(ehe, er lS el nen. 

47 struct fasync struct *fasync; 

48  /* MAE */ 

49 void *private data; 

50  void(*private free) (struct snd pcm runtime *runtime); 

51  /* WEApINDA */ 

32 struct snd pcm hardware hw; 

504. "struct snd pom hw constraints hwoconstralnts; 

54  /* 中 断 回调 函数 */ 

55  void(*transfer ack begin) (struct snd pcm substream*substream); 
56  void(*transfer ack end) (struct snd pcm substream *substream); 
57  /* jeN a */ 

58 unsigned int timer resolution; /* timer resolution */ 

59 JA DNA S 

60 unsigned char *dma area; /* DMA 区 域 */ 

61  dma addr t dma addr; /* 总 线 物理 地 址 */ 

62 size_t dma bytes; /* DMA 区 域 大 小 */ 

63 struct snd dma buffer *dma buffer p; /* 被 分 配 的 缓冲 区 */ 

64 #if defined(CONFIG SND PCM OSS) || defined(CONFIG SND PCM OSS MODULE) 
65 /* OSS4u. */ 

66 struct snd pcm oss runtime oss; 

67  sendif 

68 ); 




















snd pcm runtime 中 的 大 多 数 记 录 对 被 声 e diu A 数 是 只 读 的 ， 仅 仅 PCM ! 
间 层 可 从 更 新 或 修改 这 些 信息 ， 但 是 硬件 描述 、 中 断 回调 函数 、DMA 缓冲 区 信息 和 私有 数 志 
是 例外 的 。 

下 面 解释 snd pem runtime 结构 体 中 的 几 个 重要 成 员 。 

(1) 硬件 描述 
硬件 描述 (snd_pcm_hardware 结构 体 ) 包含 了 基本 硬件 配置 的 定义 ， 需 要 在 open) K A 
值 。runtime 实例 保存 的 是 硬件 描述 的 拷贝 而 非 指 针 ， 这 意味 着 在 open0 函 数 中 可 以 修改 被 拷贝 的 
HR 〈runtime->hw)， 例 如 : 


struct snd pcm runtime *runtime = substream-»runtime; 























n 

















IHI 














































































































runtime->hw = snd xxchip playback hw; /* generic 的 硬件 描述 */ 
/* 特定 的 硬件 描述 */ 

if (chip->model == VERY OLD ONE) 

runtime-»hw.channels max = 1; 


snd pem hardware 结构 体 的 定义 如 代码 清单 17.14 所 示 。 





























代码 清单 17.14 snd pcm hardware 结构 体 


1 struct snd pcm hardware í( 
2 unsigned int info; /* SNDRV PCM INFO * / 
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u64 formats; /* SNDRV PCM FMTBIT * */ 
unsigned int rates; /* SNDRV PCM RATE * */ 
unsigned int rate min; /* 最 小 采样 率 */ 
unsigned int rate max; /* 最 大 采样 率 */ 
unsigned int channels min; /* 最 小 的 通道 数 */ 
unsigned int channels max; /* 最 大 的 通道 数 */ 

9 size t buffer bytes max; /* 最 大 缓冲 区 大 小 */ 

10 size t period bytes min; /* 最 小 周期 大 小 */ 

11 size t period bytes max; /* TRAE A */ 

12 unsigned int periods min; /* 最 小 周期 数 */ 

13 unsigned int periods max; /* 最 大 周期 数 */ 

14 size t fifo size; /* FIFO E WA */ 

sa 

snd pcm hardware 结构 体 中 的 info 字段 标识 PCM 设备 的 类 型 和 能 力 ， 形 式 为 SNDRV_PCM_ 























INFO XXX. info 字段 至 少 需 要 定义 是 否 支 持 mmap， 当 支持 时 ， 应 设置 SNDRV_PCM INFO MMAP 
标志 ; 当 硬 件 支 持 interleaved 或 non-interleaved 格式 时 , 应 设置 SNDRV_PCM INFO INTERLEAVED 
或 SNDRV_PCM INFO NONINTERLEAVED 标志 ; 如 果 都 支持 ， 则 两 者 都 可 设置 。 
MMAP VALID fll BLOCK. TRANSFER 标志 针对 OSS mmap, KA mmap 被 真正 支持 时 ， 才 
可 设置 MMAP VALID; SNDRV_PCM INFO PAUSE 意味 着 设备 可 支持 暂停 操作 ， 而 SNDRV_ 
PCM INFO RESUME 意味 着 设备 可 文 持 挂 起 /恢复 操作 ; 当 PCM 子 流 能 被 同步 ， 如 同步 播放 和 
录音 流 的 start/stop, PiE SNDRV_PCM INFO SYNC START 标志 。 
formats 包含 PCM 设备 支持 的 格式 ， 形 式 为 SNDRV_PCM FMTBIT XXX， 如 果 设 备 支持 多 
模式 ， 应 将 各 种 模式 标志 进行 “或 ”操作 。 
rates 包含 了 PCM 设备 支持 的 采样 率 ， 形 式 如 SNDRV. PCM RATE XXX, WRL EEH 
采样 率 ， 则 传递 CONTINUOUS. 

rate min 和 rate_max 分 别 定义 了 最 大 和 最 小 的 采样 率 ， 注 意 : 要 与 rates 字段 相符 。 

channel min 和 channel max 定义 了 最 大 和 最 小 的 通道 数量 

buffer bytes max 定义 最 大 的 缓冲 区 大 小 ， 注 意 : 没有 buffer bytes min 字段 ， 这 是 因为 它 可 
以 通过 最 小 的 周期 大 小 和 最 小 的 周期 数量 计算 出 来 。 

period 信息 与 OSS 中 的 fragment X, XT PCM 中 断 产生 的 周期 。 更 小 的 周期 大 小 意味 着 
更 多 的 中 断 ， 在 录音 时 ， 周 期 大 小 定义 了 输入 延迟 ， 在 播放 时 ， 整 个 缓冲 区 大 小 对 应 着 输出 延迟 。 

PCM 可 被 应 用 程序 通过 alsa-lib 发 送 hw_params 来 配置 ， 配 置信 息 将 保存 在 运行 时 实例 中 。 
对 缓冲 区 和 周期 大 小 的 配置 以 帧 形式 存储 ， 而 frames to bytes()fll bytes_to_frames() 可 完成 帧 和 字 
节 的 转换 ， 如 : 

period bytes = frames to bytes(runtime, runtime-»period size); 

(22 DMA RW [X fei fs.» 

包含 dma area CZ SH BE). dma addr (物理 地 址 )、dma _bytes《〈 组 种 区 大 小 ) 和 dma private 
(被 ALSA DMA 分 配器 使 用 )。 可 以 由 snd_pcm_ lib malloc pages(0 实 现 ,ALSA 中 间 层 会 设置 DMA 
缓冲 区 信息 的 相关 字段 ， 这 种 情况 下 ， 驱 动 中 不 能 再 写 这 些 信息 ， 只 能 读 取 。 也 就 是 说 ， 如 果 使 
标准 的 缓冲 区 分 配 函 数 snd pem lib _ malloc_pages0 分 配 缓冲 区 ， 则 我 们 不 需要 自己 维护 DMA 
缓冲 区 信息 。 如 果 缓 冲 区 由 自己 分 配 ， 则 需要 在 hw_params(0) 函 数 中 管理 缓冲 区 信息 ， 至 少 需 管理 
dma bytes 和 dma addr, 如 果 支 持 mmap, 则 必须 管理 dma_area, 对 dma_private 的 管理 视 情 况 而 定 。 


























































































































i-i 
































o 








































































































































































































































































































































































































































































































408 INUX 





Linux 音频 设备 驱动 


(3) 运行 状态 。 
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(4) 私有 数据 。 
驱动 中 可 以 为 子 流 分 配 一 段 内 存 并 

















V 
































data 混淆 ， 后 者 一 般 指 向 xxxchip， 而 前 者 是 在 PCM 设备 的 open) EK fc 2) ROTE 7] 4 
static int snd xxx open (struct snd pcm substream *substream) 


{ 
Struct xxx pcm data *data; 























data = kmalloc(sizeof(*data), GFP KERNEL); 
substream-»runtime-»private data = data; /* WM runtime-»private data */ 


) 
(5) 中 断 回调 函数 : 














通过 runtime->status 可 以 获得 运行 状态 ， 它 是 snd pem mmap status 结构 体 的 指针 ， 例 如 ， 
通过 runtime->status->hw_ptr 可 以 获得 目前 的 DMA 硬件 指针 。 此 外 ， 通 过 runtime->control 可 以 
获得 DMA 应 用 指针 ， 它 指向 snd pcm_mmap_control 结构 体 指 针 ， 但 是 不 建议 直接 访问 该 指针 。 


WEZA runtime->private data， 注 意 不 要 与 pem->private_ 


居 ， 例 如 : 








transfer ack_begin() 和 transfer_ ack_end0O) 函 数 分 别 在 snd_pcm_period_elapsed() 的 开始 和 














被 调用 。 
根据 以 上 分 析 ， 代 码 清单 17.15 给 出 了 一 个 完整 的 PCM 设备 接口 模板 。 


代码 清单 17.15 PCM 设备 接口 模板 


















































1  f£include «sound/pcm.h-» 

2 EE 

3 /* 播放 设备 硬件 定义 */ 

4 Static struct snd pcm hardware snd xxxchip playback hw = { 

5 .info = (SNDRV PCM INFO MMAP | SNDRV PCM INFO INTERLEAVED | 
6 SNDRV PCM INFO BLOCK TRANSFER | SNDRV PCM INFO MMAP VALID), 
di .formats - SNDRV PCM FMTBIT S16 LE, 

8 .rates = SNDRV PCM RATE 8000 48000, 

9 .rate min - 8000, 

0 .rate max - 48000, 

i .channels min = 2, 

2 .channels max - 2, 

3 .buffer bytes max = 32768, 

4 .period bytes min = 4096, 

D .period bytes max = 32768, 

6 .periods min = 1, 

1i .periods max = 1024, 

8 y 

9 

20 /* aE ee SEX */ 

21 static struct snd pcm hardware snd xxxchip capture hw = ( 

22 .info = (SNDRV PCM INFO MMAP | SNDRV PCM INFO INTERLEAVED | 
23 SNDRV PCM INFO BLOCK TRANSFER | SNDRV PCM INFO MMAP VALID), 
24 .formats - SNDRV PCM FMTBIT S16 LE, 

25 .rates = SNDRV PCM RATE 8000 48000, 

26 .rate min - 8000, 

2 .rate_max = 48000, 

28 .channels min = 2, 

29 .channels_max = 2, 


2E 
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.buffer bytes max = 32768, 
.period bytes min = 4096, 


.period bytes max = 32768, 
.periods min - 1, 
.periods max - 1024, 

}; 











/* 播放 : 打开 函数 */ 
static int snd xxxchip playback open(struct snd pcm substream*substream) 
{ 

struct xxxchip *chip = snd pcm substream chip (substream); 





struct snd pcm runtime *runtime = substream-»runtime; 
runtime-»hw = snd xxxchip playback hw; 
/* ”硬件 初始 化 代码 */ 


return 0; 


/* 播放 : 关闭 函数 */ 
static int snd xxxchip playback close(struct snd pcm substream*substream) 
( 

struct xxxchip *chip = snd pcm substream chip (substream); 

/* ”硬件 相关 的 代码 */ 


return 0; 














/* 录音 : 打开 函数 */ 
static int snd xxxchip capture open(struct snd pcm substream*substream) 
( 

struct xxxchip *chip = snd pcm substream chip (substream); 





struct snd pcm runtime *runtime = substream-»runtime; 
runtime-»hw = snd xxxchip capture hw; 
/* ”硬件 初始 化 代码 */ 


return 0; 


/* 录音 : 关闭 函数 */ 
static int snd xxxchip capture close(struct snd pcm substream*substream) 
{ 
struct xxxchip *chip = snd_pcm_substream_chip (substream); 
/* ”硬件 相关 的 代码 */ 
return 0; 
j 
/* hw params K% */ 
static int snd xxxchip pcm hw params (struct snd pcm substream*substream, struct 
snd pcm hw params *hw params) 


return snd pcm lib malloc pages(substream, params buffer bytes (hw params)); 


/* hw free 函数 */ 
static int snd xxxchip pcm hw free(struct snd pcm substream*substream) 


return snd pcm lib free pages (substream); 








/* prepare 函数 */ 
static int snd xxxchip pcm prepare(struct snd pcm substream*substream) 
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eoo 





























SS 

86 struct xxxchip *chip - snd pcm substream chip (substream); 
87 struct snd pcm runtime *runtime = substream-»runtime; 

88 /* 根据 目前 的 配置 信息 设置 硬件 

89 * 例如 : 

90 e 

91 xxxchip set sample format(chip, runtime-»format); 

92 xxxchip set sample rate(chip, runtime-»rate); 

93 xxxchip set channels(chip, runtime-»channels); 

94 xxxchip set dma setup(chip, runtime-»dma addr, chip-»buffer size, chip 
95 -»period size); 

96 return 0; 

9T jJ 


98 /* trigger HU */ 
99 static int snd xxxchip pcm trigger(struct snd pcm substream*substream, int cmd) 
00 ( 








01 Switch (cmd) 

02 case SNDRV_PCM_TRIGGER_START: 

03 /* do something to start the PCM engine */ 
04 break; 

05 case SNDRV PCM TRIGGER STOP: 

06 /* do something to stop the PCM engine */ 
07 break; 

08 default: 

09 return - EINVAL; 

9 


/* pointer 函数 */ 
Static snd pcm uframes t snd xxxchip pcm pointer(struct snd pcm substream 


T 

2 

3 

4 

5  *substream) 
6 

7 struct xxxchip *chip = snd_pcm_substream_chip (substream); 
8 


unsigned int current ptr; 
9 ”/* 获 得 当前 的 硬件 指针 */ 


20 current ptr - xxxchip get hw pointer(chip); 








2a return current ptr; 

223 

23 /* 放 音 设备 操作 集 */ 

24 sLabtio struct snd pom ops snd.xxxchip.playback.ops — | 


ar 





25 .open = snd xxxchip playback open, 


26 .Close = snd xxxchip playback close, 
2T saxea = oo en 1999. oel 

28 .hw_params = snd xxxchip pcm hw params, 
29 .hw_free = snd xxxchip pcm hw free, 

30 .prepare - snd xxxchip pcm prepare, 

imn .trigger = snd xxxchip pcm trigger, 

92 .pointer = snd xxxchip pcm pointer, 

33 dg 


34 /* 录音 设备 操作 集 */ 


35 static struct snd pcm ops snd xxxchip capture ops - ( 


Ar 





36 .open = snd xxxchip capture open, 
S .Close = snd xxxchip capture close, 





38 "ioc Sho ovement es 
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39 .hw params = snd xxxchip pcm hw params, 

40 .hw free - snd xxxchip pcm hw free, 

41 .prepare = snd xxxchip pcm prepare, 

42 .trigger = snd xxxchip pcm trigger, 

43 .pointer - snd xxxchip pcm pointer, 

44 j; 

45 

46 /* 创建 一 个 BCM 设备 */ 

47 static int | devinit snd xxxchip new pcm(struct xxxchip *chip) 

48 { 

AD ee il e :oom 

50 int err; 

51 人 
52 return err; 

53  pcm-»private data - chip; 

54 GESTOS (qoxehüc Nane Ub (Jas). 

55 chip-»pcm - pom; 

56  /* WEMESE*/ 

57 snd pcm set ops (pem, SNDRV PCM STREAM PLAYBACK, snd xxxchip playback ops); 
58 snd pcm set ops (pcm, SNDRV PCM STREAM CAPTURE,  &snd xxxchip capture ops); 
59 /* 分 配 缓冲 区 */ 

60 snd pom lib preallocate pages for all(pcm, SNDRV DMA TYPE DEV, 

61 smeomemaspe mdat ene — 99 jexemi). (94b ENOZAL 9 Vb p 

62 return 0; 

$3 p 


17.44 控制 接口 


1. control 
空 制 接口 对 于 许多 开关 (switch) 和 调节 器 Cslider) 而 言 应 用 相当 广泛 ， 它 能 从 用 户 空间 被 
FR. control 的 最 主要 用 途 是 mixer， 所 有 的 mixer 元 素 基 于 control 内 核 API 实现 , 在 ALSA 中 ， 
control 用 snd_kcontrol 结构 体 描述 。 
ALSA 有 一 个 定义 很 好 的 AC97 控制 模块 ， 对 于 仅 文 持 AC97 的 芯片 而 言 ， 不 必 实现 本 节 的 
内 容 。 
创建 一 个 新 的 control 至 少 需要 实现 snd. kcontrol new 中 的 info0、get0 和 putO 这 3 个 成 员 函 
数 ，snd_kcontrol new 结构 体 的 定义 如 代码 清单 17.16 所 示 。 
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代码 清单 17.16 snd kcontrol new 结构 体 


struct snd- koontrol new 4 
snd ctl elem iface t iface; a SNDRV CTL ELEM IFACE XXX */ 








Ji 

2 

3 unsigned int device; /* 设备 号 */ 

4 unsigned int subdevice; /* Fü TRA) 号 */ 
5 unsigned char *name; /* ZPR (ASCII 格式 ) */ 
6 
3! 
8 








unsigned int index; /* 索引 */ 

unsigned int access; /* 访问 权限 */ 

unsigned int count; /* 享用 元 素 的 数量 */ 
9 enel kecontrol tato p vinte? 























10 snd kcontrol get t *get; 
TUR snd kcontrol put t *put; 
L2 unsigned long private_ value; 
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iface 字段 定义 了 control 的 类 型 , 形式 为 SNDRV_CTL ELEM IFACE XXX, 通常 是 MIXER, 
对 于 不 属于 mixer 的 全 局 控制 ， 使 用 CARD。 如 果 关 联 于 某 类 设备 ， 则 使 用 HWDEP、PCM、 
RAWMIDI、TIMER 或 SEQUENCER。 

name 是 名 称 标识 字符 串 ，control 的 名 称 非常 重要 ， 因 为 control 的 作用 由 名 称 来 区 分 。 对 于 
名 称 相同 的 control, 则 使 用 index 区 分 。name 定义 的 标准 是 “SOURCE DIRECTION FUNCTION” 
即 “ 源 方向 功能 ” SOURCE 定义 了 control WHY, W “Master”, “PCM”, “CD” JI “Line”, 
方向 则 为 “Playback”“Capture”“Bypass Playback” 或 “Bypass Capture”， 如 果 方 向 省 略 ， 意 味 
着 playback 和 capture 双向 ， 第 3 个 参数 可 以 是 “Switch”“Volume” 和 “Route” 等 。 

“SOURCE DIRECTION FUNCTION ”格式 的 名 称 例子 如 “Master Capture Switch”, “PCM Playback 
Volume", 

下 面 几 种 control 的 命名 不 采用 “SOURCE DIRECTION FUNCTION” 格 式 ， 属 于 例外 。 

(1) 全 局 控制 。 

“Capture Source", “Capture Switch” 和 “Capture Volume ”用 于 全 局 录音 源 、 输 入 开关 和 录 
音 音量 控制 ;“Playback Switch", “Playback Volume ”用 于 全 局 输出 开关 和 音量 控制 。 

(2) 音调 控制 。 
音调 控制 名 称 的 形式 为 “Tone Control - XXX", 例如 “Tone Control — Switch”, “Tone Control - Bas” 
和 “Tone Control — Center”。 

(3) 3D 控制 。 

3D 控制 名 称 的 形式 为 “3D Control -XXX”, 例 如 “3D Control — Switch”“3D Control — Center" 
和 “3D Control - Space". 

(4) 麦克 风 增 益 (Mic boost). 

麦克 风 增 益 被 设置 为 “Mic Boost” 或 “Mic Boost (6dB)”。 

snd_kcontrol new 结构 体 的 access 字段 是 访问 控制 权限 ， 形 式 如 SNDRV CTL ELEM - 
ACCESS XXX. SNDRV CTL ELEM ACCESS READ 意味 着 只 读 ， 这 时 putQPA Zi Sc 
现 ; SNDRV CTL ELEM ACCESS WRITE 意味 着 只 写 , 这 时 getO 函 数 不 必 实现 。 若 control 
值 频繁 变化 ， 则 需 定义 VOLATILE 标志 。 当 control 处 于 非 激 活 状态 时 ， 应 设置 INACTIVE 
标志 。 

private value 字段 包含 一 个 长 整 型 人 

2. info() 函 数 

snd kcontrol new 结构 体 中 的 info0 函 数 用 于 获得 该 control 的 详细 信息 ,该 函数 必须 填充 传递 
给 它 的 第 二 个 参数 snd_ctL_elem_info 结构 体 ，info0 函 数 的 形式 如 下 : 


statio int snd-xxxctloinfo(struct sand kcontrol *kcontrol, struct snd-ctl-elemcinfo Te 


snd ctl elem info 结构 体 的 定义 如 代码 清单 17.17 所 示 。 
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可 以 通过 它 给 info), getOl putO 函 数 传递 参数 。 










































































代码 清单 17.17  snd ctl elem info 结构 体 


T. stroet snd ctl slem info 

2 4 

3 struct snd ctl elem id id; /* W: oe ID */ 

4 snd ctl elem type t type; /* R: HÆÆ - SNDRV CTL ELEM TYPE * */ 

5 unsigned int access; /* R: 值 访问 权限 (ie) - SNDRV CTL ELEM ACCESS * */ 
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6 unsigned int count; /* 值 的 计数 */ 

7 pid t owner; /* 该 control 的 拥有 者 PID */ 
8 union { 

9 Struct 

0 long min; /* R: 最 小 值 */ 

1 long max; /* R: RANE */ 

2 long step; /* R: füzbx (0 TEER */ 
3 ) integer; 

4 SEO 人 

5 long long min; /* R: 最 小 值 */ 

6 long long max; /* R: A&XÍíü */ 

7 long long step; /* R: 值 步 进 (0 可 变 的 ) */ 
8 ) integer64; 

E struct 4 

20 unsigned int items; /* R: 项 目 数 */ 
21 unsigned int item; /* w: 项 目 号 */ 
27 char name[64]; /* R: 值 名 称 */ 

23 } enumerated; /* 枚 举 */ 

24 unsigned char reserved[128]; 

29) H 

26 value; 

Zu union ( 

28 unsigned short d[4]; 

29 unsigned short *d ptr; 


30 ) dimen; 
SH unsigned char reserved[64-4 * sizeof(unsigned short)]; 
SN 


snd ctl elem info 结构 体 的 type 字段 定义 了 control 的 类 型 ,包括 BOOLEAN INTEGER, 
ENUMERATED, BYTES. IEC958 和 INTEGER64. count 字段 定义 了 这 个 control 中 包含 的 
元 素 的 数量 ， 例 如 一 个 立体 声音 量 control 的 count = 2。value 是 一 个 联合 体 ， 其 所 存储 的 值 
的 具体 类 型 依赖 于 type。 代 码 清单 17.18 所 示 为 一 个 info £& 2238 78 snd. ctl elem. info 结构 体 
的 范例 。 
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代码 清单 17.18. snd ctl elem info 结构 体 中 的 info() 函 数 范 例 


ECVETG me me pe lee ee me aaron le ol le I el 








2 snd ctl elem info *uinfo) 

ue 

4 uinfo-»type = SNDRV CTL ELEM TYPE BOOLEAN; /* 类 型 为 BOOLEAN */ 
5 uinfo-»count = 1;/* 数量 为 1 */ 

6 uinfo-»value.integer.min = 0;/* 最 小 值 为 0 */ 

7] uinfo-»value.integer.max = 1;/* 最 大 值 为 1 */ 

8 return 0; 

9 














枚 举 类 型 和 其 他 类 型 略 有 不 同 ， 对 枚 举 类 型 ， 应 为 目前 项 目 索 引 设置 名 称 字符 串 ， 如 代码 清 
单 17.19 所 示 。 



























































代码 清单 17.19 填充 snd_ctl_elem_info 结构 体 中 的 权 举 类 型 值 


ER 
snd ctl.elem info *uinfo) 


pun 


/* 值 名 称 字 符 下 





vj 
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5tagtic char *te«xrs[2] = 1 

Hrist, SET 
FE 
uinfo->type = SNDRV CTL ELEM TYPE ENUMERATED; /* 枚 举 类 型 */ 
uinfo->count = 1;/* 数量 为 1 */ 
uinfo->value.enumerated.items = 4;/* 项 目 数量 为 1 */ 
/* 超过 3 的 项 目 号 改 为 3 */ 


if (uinfo-»value.enumerated.item > 3) 


























uinfo-»value.enumerated.item = 3; 
/* 为 目前 项 目 索引 复制 名 称 字符 串 */ 
strcpy(uinfo-»value.enumerated.name, texts[uinfo-»value.enumerated.item]); 
return 0; 








3. get() 函 数 
get0 函 数 用 于 得 到 control 的 目前 值 并 返回 用 户 空间 ， 代 码 清单 17.20 所 示 为 get0 函 数 的 范例 。 
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代码 清单 17.20  snd ctl elem info 结构 体 中 的 get() 函 数 范 例 


Sobuenmme se oe Struct ES Td een toontr ol S E RUCE 


snd ctl elem value *ucontrol) 


/* 从 snd kcontrol 获得 xxxchip 指针 */ 

geriet eeen enho = ene oone eo en (em 

/* 从 xxxchip 获得 值 并 写 入 snd ctl elem value */ 
ucontrol-»value.integer.value[0] = get some value (chip); 





return 0; 





























get0 函 数 的 第 二 个 参数 的 类 型 为 snd_ctlL_elem_value， 其 定义 如 代码 清单 10.21 所 示 。snd_ctL_ 
elem | value 结构 体 的 内 部 也 包含 一 个 由 integer、integer64、enumerated 等 组 成 的 值 联 合体 ， 它 的 
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人 体 类 型 依赖 于 control 的 类 型 和 info0 函 数 。 


代码 清单 17.21 snd ctl elem value 结构 体 


struct snd ctl elem value 


{ 


struct snd ctl elem id id; /* W: JGX ID */ 
unsigned int indirect: 1; /* Ww: 使 用 间接 指针 (xxx ptr 成 员 ) */ 
/* 值 联合 体 */ 


union { 

















LE 
long value[128]; 
long *value ptr; 
) integer; 
BIELOD d 
long long value[64]; 
long long *value ptr; 
) integer64; 
union ( 
unsigned int item[128]; 
unsigned int *item ptr; 
) enumerated; 
union 1 
unsigned char data[512]; 
unsigned char *data ptr; 
) bytes; 








eoo 
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23 struct snd aes iec958 iec958; 

24 ) 

25 valves 4/55 RE 5 

26 struct timespec tstamp; 

2 unsigned char reserved[128-sizeof(struct timespec)]; 
28 ); 


4. put() 函 数 
putO 用 于 从 用 户 空 间 写 入 值 ， 如 果 值 被 改变 ， 该 函数 返回 1， 否 则 返回 0; 如 果 发 生 错 误 ， 该 
函数 返回 一 个 错误 码 。 代 码 清单 17.22 所 示 为 一 个 putO 函 数 的 范例 。 


代码 清单 17.22 snd ctl elem info 结构 体 中 的 put() 函 数 范例 





































































































Tel (te Sn el em es 
2 smel ctl elem value "*ucontrol) 

Sr CN 

4 /* 从 snd kcontrol 获得 xxxchip 指针 */ 

5 struct xxxchip *chip = snd kcontrol chip (kcontrol); 

6 

7) 

8 











int changed = 0;/* 默认 返回 值 为 0 */ 
/* 值 被 改变 */ 

















if (chip-»current value != ucontrol-»value.integer.value[0]) { 
g change_current_value (chip, ucontrol->value.integer.value[0]); 
10 changed = 1;/* jR|H[H7jy1 */ 
TE } 
T2 return changed; 
is Jy 




















对 于 get0 和 putO0 函 数 而 言 ， 如 果 control 有 多 于 一 个 元 素 ， 即 count >1， 则 每 个 元 素 都 需要 被 
或 写 入 。 

5. 构造 control 

当 所 有 事情 准备 好 后 ， 我 们 需要 创建 一 个 control， 调 用 snd_ctl_add0 和 snd_ctl_ new10 这 两 个 
函数 来 完成 ， 这 两 个 函数 的 原型 为 : 


dme sme eri ce se en ne om 











si 
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struct snd kcontrol *snd ctl newl(const struct snd kcontrol new *ncontrol, 
void *private data); 


snd ctl new10 函 数 用 于 创建 一 个 snd kcontrol 并 返回 其 指针 ，snd_ctL_add0 函 数 用 于 将 创建 的 
snd kcontrol 添加 到 对 应 的 card 中 。 

6. 变更 通知 

如 果 驱 动 中 需要 在 中 断 服 务 程 序 中 改变 或 更 新 一 个 control， 可 以 调用 snd_ctl_notify0O 函 数 ， 
此 函数 原型 为 : 

void snd ctl notify(struct snd card *card, unsigned int mask, struct snd ctl elem id *id); 


该 函数 的 第 二 个 参数 为 事件 掩 码 (event-mask)， 第 三 个 参数 为 该 通知 的 control 元 素 id 指针 。 

例如 ， 如 下 语句 定义 的 事件 掩 码 SNDRV_CTL EVENT MASK VALUE 意味 着 control 值 的 
改变 被 通知 : 

snd ctl notify(card, SNDRV CTL EVENT MASK VALUE, id pointer); 
17.4.5 AC97 API 接口 

ALSA ACO97 编 解 码 层 被 很 好 地 定义 ， 利 用 它 ， 驱 动工 程 师 只 需 编写 















































































































































底层 的 控制 函数 。 
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1. AC97 实例 构造 
为 了 创建 一 个 AC97 实例 ,首先 需要 调用 snd_ac97_busO0 函 数 构建 AC97 总 线 及 其 操作 ， 这 个 
函数 的 原型 为 : 


Tac Sael aco TS SEIS GST e Cad Ce dI oie mumy Series SD mde) us 5 9S 


oo6 





















































void *private data, struct snd ac97 bus **rbus); 


该 函数 的 第 3 个 参数 ops 是 一 个 snd ac97 bus ops 结构 体 ， 其 定义 如 代码 清单 17.23 所 示 。 



































代码 清单 17.23 snd_ac97_bus_ops 结构 体 


ib GT SD Cede 9 IST OI SN 
void(*reset) (struct snd ac97 *ac97); /* 复位 函数 */ 
/* 写 入 函数 */ 





iL 

2 

3 

4 void(*write) (struct snd ac97 *ac97, unsigned short reg, unsigned short val); 
E /* 读 取 函 数 */ 
6 

3l 

8 











unsigned short(*read) (struct snd ac97 *ac97, unsigned short reg); 
void(*wait) (struct snd ac97 *ac97); 
EN 
OR 
接 下 来 ， 调 用 snd_ac97_mixer0O 函 数 注册 混 音 器 ， 这 个 函数 的 原型 为 
int snd ac97 mixer(struct snd ac97 bus *bus, struct snd ac97 template *template, struct 
snd ac97 **rac97); 


代码 清单 17.24 所 示 为 AC97 实例 的 创建 过 程 。 


















































代码 清单 17.24 ACO7 实例 的 创建 过 程 范例 

struct snd ac97 bus *buss 
/* AC97 总 线 操作 */ 
Static St ut Sr ced COINS OD op NU 

.write = snd mychip ac97 write, 

.read = snd mychip ac97 read, 
; 
/* AC97 总 线 与 操作 创建 */ 
snd ac97 bus(card, 0, &ops, NULL, &bus); 
/* AC97 模板 */ 
struct snd ac97 template ac97; 





AO COD oper Ut use G»cNX 


WE ur 0, sizeof(ac97)); 
ac97.private data = chip;/* Tfi */ 
/* 注册 混 音 器 */ 
snd ac97 mixer(bus, &ac97, &chip-»ac97); 
上 述 代 码 第 一 行 的 snd ac97. bus 结构 体 指针 bus 的 指针 被 传 入 第 8 行 的 snd_ac97_bus0 函 数 
被 赋值 ，chip->ac97 的 指针 被 传 入 第 15 行 的 snd_ac97_mixer() 并 被 赋值 ，chip->ac97 将 成 员 新 
创建 AC97 实例 的 指针 。 
如 果 一 个 声卡 上 包含 多 个 编 解码 器 ， 这 种 情况 下 ， 需 要 多 次 调用 snd_ac97_mixer() 并 对 snd_ac97 的 
num 成 员 ( 编 解码 器 序号 ) 赋予 相应 的 序号 。 驱动 中 可 以 为 不 同 的 编 解 码 器 编写 不 同 的 snd_ac97_bus_ops 
成 员 函 数 中 ， 或 者 只 是 在 相同 的 一 套 成 员 函 数 中 通过 ac97.num 获得 序号 后 再 区 分 进行 具体 的 操作 。 
2. snd ac97 bus ops 成 员 函 数 
snd ac97 bus ops 结构 体 中 的 read0 和 write0 成 员 函 数 完 成 底层 的 硬件 访问 ，resetO 函 数 
用 于 复位 编 解码 器 ，waitO 函 数 用 于 编 解码 器 标准 初始 化 过 程 中 的 特定 等 待 ， 如 果 芯 片 要 求 额 


(Ox de (09 R9) ES 
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外 的 等 待 时 间 ， 则 应 实现 这 个 函数 ，initO 用 于 完成 
所 示 为 read() 和 writeO 函 数 的 范例 。 


En 


解码 器 附加 的 初始 化 。 代 码 清单 17.25 














代码 清单 17.25 snd ac97 bus ops 结构 体 中 的 read() 和 write() 函 数 范例 














1 static unsigned short snd xxxchip ac97 read(struct snd ac97 *ac97, unsigned 
2 short reg) 

ONE 

4 struct xxxchip *chip - ac97-»private data; 

5 — 

6 return the register value; /* 返回 寄存 器 值 */ 

T. Jj 

8 

9 static void snd xxxchip ac97 write(struct snd ac97 *ac97, unsigned short reg, 
10 unsigned short val) 

JE. 

12 struct xxxchip *chip - ac97-»private data; 

T3 SESA 

14 /* 将 被 给 的 寄存 器 值 写 入 codec 

15. 


3. 修改 寄存 器 
如 果 需 要 在 驱动 中 访问 编 解 码 器 ， 可 使 用 如 下 函数 : 


void snd.ac97 write(struct snd ac97 *ac97, unsigned short reg, unsigned short value); 
























































int snd ac97 update(struct snd ac97 *ac97, unsigned short reg, unsigned short value); 


int snd ac97 update bits (struct snd ac97 *ac97, unsigned short reg, unsigned short mask, 
unsigned short value); 


unsigned short snd ac97 read(struct snd ac97 *ac97, unsigned short reg); 

snd ac97 update().j void snd_ac97_write0 的 区 别 在 于 前 者 在 值 已 经 设置 的 情况 下 不 会 再 设 
置 ， 而 后 者 则 会 再 写 一 次 。snd_ac97_update_bitsO) 用 于 更 新 寄存 器 的 某 些 位 ， 由 mask 决定 。 

除 此 之 外 ， 还 有 一 个 函数 可 用 于 设置 采样 率 : 

int snd ac97.set rate(struct snd ac97 *ac97, int reg, unsigned int rate); 


这 个 函数 的 第 二 个 参数 reg 可 以 是 AC97 PCM. MIC ADC. RATE. AC97 PCM FRONT DAC 
RATE, AC97 PCM LR ADC RATE 和 AC97_SPDIF， 对 于 AC97 _SPDIF 而 言 ， 寄 存 器 并 非 真 
地 被 改变 了 ， 只 是 相应 的 IEC958 状态 位 将 被 更 新 。 

4. 时 钟 调整 
在 一 些 蕊 片上 ， 编 解码 器 的 时 钟 频率 不 是 48000Hz， 而 是 使 用 PCI 时钟 以 节省 一 个 晶振 ， 在 这 
种 情况 下 ， 我 们 应 该 改变 bus->clock 为 相应 的 值 ， 例 如 intel8x0 和 es1968 包含 时 钟 的 自动 测量 函数 。 

5. proc 文件 

ALSA AC97 接 口 会 创建 如 /proc/asound/card0/codec97#0/ac97#0-0 和 ac97#0-0+regs 这 样 的 proc 
文件 ， 通 过 这 些 文件 可 以 查看 编 解码 器 目前 的 状态 和 寄存 器 。 

如 果 一 个 芯片 上 有 多 个 codecs， 可 多 次 调用 snd_ ac97_mixer()。 


17.4.6 ALSA 用 户 空 间 编 程 
ALSA 驱动 的 声卡 在 用 户 空间 不 宜 直 接 使 用 文件 接口 ， 而 应 使 用 alsa-lib， 代 码 清单 17.26 所 
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示 为 基于 ALSA 音频 驱动 的 最 简单 的 播放 应 用 程序 。 Q 
代码 清单 17.26 ALSA 用 户 空间 播放 程序 
el re “ree ll In 
2- 4include «stdlib.h» 
3 4$include «alsa/asoundlib.h» 
4 
5j oleae. nes leue Seow ii) 
NE 
7 hae ip 
8 int err; 
9 imei Texte [12 Sy] P 
0  snd poem t *playback handle; /* PCM 设备 句柄 */ 
1  snd pcm hw params t *hw params; /* 硬件 信息 和 PCM 流 配 置 */ 
2 /* 打开 PCM， 最 后 一 个 参数 为 0 意味 着 标准 配置 */ 
3 if ((err = snd pcm open(&playback handle, argv[1], SND PCM STREAM PLAYBACK, 0) 
4 DEN OD NET 
5 fprintf(stderr, "cannot open audio device $s ($s)WXn", argv[1], snd strerror 
6 (err)); 
7 exit (1); 
8 } 
9  /* 分 配 snd pcm hw params 七 结构 体 */ 
20 if ((err -» snd pcm hw params malloc(&hw params)) « O0) ( 
2L fprintf(stderr, "cannot allocate hardware parameter structure ($s)Nn", 
22 snd strerror(err)); 
23 exit (1); 
24 } 
25 /* 初始 化 hw_params */ 
26 if ((err = snd pcm hw params any(playback handle, hw params)) < 0) { 
24 fprintf (stderr, "cannot initialize hardware parameter structure ($s)Wn", 
28 snd strerror(err)); 
29 exit(1); 
30 } 
31  /* 初始 化 访问 权限 */ 
92 if ((err = snd pcm hw params set access(playback handle, hw params, 
33 SND PCM ACCESS RW INTERLEAVED)) < 0) ( 
34 fprintf(stderr, "cannot set access type ($s)Mn", snd strerror(err)); 
35 exit(1); 
36 j 
37  /* 初始 化 采样 格式 */ 
38 if ((err = snd pcm hw params set format(playback handle, hw params, 
39 SND PCM FORMAT S16 LE)) « 0) ( 
40 fprintt(stderr, "cannot set sample format (*55)n', sna strerror(err))s 
41 exit(1); 
42 ) 
43  /* 设置 采样 率 ， 如 果 硬 件 不 支持 我 们 设置 的 采样 率 ， 将 使 用 最 接近 的 */ 
44 if ((err = snd pcm hw params set rate near (playback handle, hw params, 44100, 
45 (09 x 9 
46 fprintf(stderr, "cannot set sample rate ($s)n", snd strerror(err)); 
4] exit(1); 
4 8 } 
49 /* 设置 通道 数量 */ 
50 if ((err = snd pcm hw params set channels(playback handle, hw params, 2)) < O) ( 
ST fprintf(stderr, "cannot set channel count ($s)Mn", snd strerror(err)); 
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52 exit(1); 

53 } 

54  /* baa hw params */ 

59 if ((err = snd pcm hw_params (playback_handle, hw_params)) < 0) { 





56 fprintf(stderr, "cannot set parameters ($s)Mn", snd strerror(err)); 
57] exit (1); 
58 j 


59  /* AIMH snd pcm hw params 七 结构 体 */ 

60 snd pcm hw params free(hw params); 

61  /* 完成 硬件 参数 设置 ， 使 设备 准备 好 */ 

62 if ((err = snd pcm prepare(playback handle)) < 0) { 


63 fprintf(stderr, "cannot prepare audio interface for use ($s)n", 
64 SOA Senesereseseronie LETENNI 

65 exit (1); 

66 ] 

67 


68 for (i -» 0; i « 10; ci) ( 
69 /* 写 音频 数据 到 PCM 设备 */ 


70 if ((err = snd pcm writei(playback handle, buf, 128)) !- 128) ( 

71 fprintf(stderr, "write to audio interface failed ($s)Mn", snd strerror 
72 (err)); 

gu exit (1); 

74 ) 

NIS } 


76  /* 关闭 PCM 设备 句柄 */ 
7T] snd pcm close(playback handle); 
78 exit (0); 
TIS d 


ERRE UEH, ALSA 用 户 空 间 编 程 的 流程 与 17.3.4 小 节 给 出 的 OSS 驱动 用 户 空间 编 
程 的 流程 基本 是 一 致 的 ， 都 经 过 了 “打开 一 设置 参数 一 读 写 音频 数据 ”的 过 程 ， 不 同 在 于 OSS H 
开 的 是 设备 文件 ， 设 置 参数 使 用 的 是 ioct10) 系 统 调用 ， 读 写 音频 数据 使 用 的 是 read()、write0 文 件 
API， 而 ALSA 则 全 部 使 用 alsa-lib 中 的 API. 

把 上 述 代码 第 70 4TH snd pem writei0 函 数 蔡 换 为 snd_pcm_readi0， 变 成 了 一 个 最 简单 的 录音 程序 。 

代码 清单 17.27 的 程序 打开 一 个 音频 接口 ， 配 置 它 为 立体 声 、16 位 、44.1kHz 采样 和 基于 
interleave 的 读 写 。 它 阻塞 等 待 直接 接口 准备 好 接收 放 音 数据 ， 这 时 候 将 数据 复制 到 缓冲 区 。 
这 种 设计 方法 使 得 程序 很 容易 移植 到 类 似 JACK、LADSPA、Coreaudio、VST 等 callback 机 制 
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驱动 的 系统 。 
代码 清单 17.27 ALSA 用 户 空间 播放 程序 〈 基 于“ 中断”) 
2 dinclude ... 
2 
3  snd pcm t *playback handle; 
4 short buf[4096]; 
b 
6 int playback callback(snd pcm sframes t nframes) 
D ( 
8 int err; 
9 printf ("playback callback called with $u frames Mn", nframes); 
10 /* 填充 缓冲 区 */ 
if ((err -» snd pcm writei(playback handle, buf, nframes)) « O) ( 
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2 fprintf(stderr, "write failed ($s)Mn", snd strerror(err)); ® 

3 } 

4 

5 return err; 

6. jJ 

7 

8 main(int argc, char *argv[]) 

ORE 

20 

21 snd pcm hw params t *hw params; 

22 snd pcm sw params t *sw params; 

23 snd pcm sframes t frames to deliver; 

24 diee Seutieletp 

PIE int err; 

26 erruet jexollllirel oree 

24 

28 if ((err = snd pcm open(&playback handle, argv[1], SND PCM STREAM PLAYBACK, 0) 

2/9 poss DTE 

30 

SH } 

ers 

33 if ((err = snd pcm hw params malloc(&hw params)) < 0) { 

34 

35 } 

36 

S7 if ((err = snd pcm hw params any(playback handle, hw params)) < 0) { 

38 

39 } 

40 

41 if ((err = snd pcm hw params set access(playback handle, hw params, 

42 SND PCM ACCESS RW INTERLEAVED)) < O0) ( 

43 

44 } 

45 

46 if ((err = snd pcm hw params set format(playback handle, hw params, 

47 SND PCM FORMAT S16 LE)) < 0) ( 

48 

49 } 

50 

X if ((err = snd pcm hw params set rate near(playback handle, hw params, 44100, 

52 ODE L WP 

SE 

54 } 

Do 

56 if ((err = snd pcm hw params set channels (playback handle,hw params,2))«0) ( 

57 

Dn } 

Du 

60 if ((err snd pcm hw params (playback handle, hw params)) < O) ( 

61 

62 } 

63 

64 snd pcm hw params free(hw params); 

65 

66 /* 告诉 ALSA 当 4096 个 以 上 帧 可 以 传递 时 唤醒 我 们 */ 
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67 if ((err -» snd pcm sw params malloc(&sw params)) « 0) ( 
68 
69 } 
7/0) if ((err = snd pcm sw params current(playback handle, sw params)) < 0) ( 
Hk b 
72 } 
13 /* WE 4096 帧 传递 一 次 数据 */ 
74 if ((err = snd pcm sw params set avail min(playback handle, sw params, 4096) 
m5 < 9) 4 
76 rey 
EF } 
78 /* 一 旦 有 数据 就 开始 播放 */ 
Imo if ((err = snd pcm sw params set start threshold(playback handle, sw params, 
80 93. «« 199». di 
81 Were 
82 } 
939 if ((err = snd pcm sw params(playback handle, sw params)) < 0) ( 
84 
85 } 
86 
87 /* 每 4096 帧 接口 将 中 断 内 核 ，ALSA 将 很 快 唤醒 本 程序 */ 
88 
89 if ((err = snd pcm prepare(playback handle)) < 0) { 
90 
OH ) 
92 
93 while (1) 
94 /* 等 待 ， 直 到 接口 准备 好 传递 数据 ， 或 者 1s 超时 发 生 */ 
95 if ((err = snd pcm wait(playback handle, 1000)) « O) ( 
96 
9 ) 
98 
99 /* 查 出 有 多 少 空间 可 放置 playback 数据 */ 
00 if ((frames to deliver = snd pcm avail update(playback handle)) < 0) { 
01 if (frames to deliver == - EPIPE) { 
02 fprintf(stderr, "an xrun occuredWn"); 
03 break; 
04 ) else ( 
05 fprintf(stderr, "unknown ALSA avail update return value ($d)n", 
06 frames to deliver); 
07 break; 
08 } 
09 } 
0 
1 frames to deliver - frames to deliver » 4096 ? 4096 : frames to deliver; 
2 
3 /* 传递 数据 */ 
4 if (playback callback(frames to deliver) !- frames to deliver) { 
5 
6 } 
di } 
8 
9 snd pcm close(playback handle); 
zb exit (0); 
20 
422 INUX, 
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17.5.1 ASoC 驱动 的 组 成 


ASoC (ALSA System on Chip) 是 ALSA 在 SoC 方面 的 发 展 和 演变 ， 它 在 本 质 上 仍然 属于 
ALSA, 但 是 在 ALSA 架构 基础 上 对 CPU 相关 的 代码 和 Codec 相关 的 代码 进行 了 分 离 。 其 原因 是 ， 
采用 传统 ALSA 架构 的 情况 下 ， 同 一 型 号 的 Codec 工作 于 不 同 的 CPU 时 ， 需 要 不 同 的 驱动 ， 
不 符合 代码 重用 的 要 求 。 
对 于 目前 租 入 式 系统 上 的 声卡 驱动 开发 ， 我 们 建议 读者 尽量 采用 ASoC 框架 ，ASoC 
由 3 部 分 组 成 。 

(1) Codec 驱动 。 这 一 部 分 只 关心 Codec 本 身 ， 与 CPU 平台 相关 的 特性 不 由 此 部 分 操作 。 

(2) 平台 驱动 。 这 一 部 分 只 关心 CPU 本 身 ， 不 关心 Codec。 它 主要 处 理 两 个 问题 DMA 51 
SERI SoC RRR PCM, PS xk AC '97 数字 接口 控制 。 

(3) 板 驱 动 〈 也 称 为 machine 驱动 )。 这 一 部 分 将 平台 驱动 和 Codec 驱动 绑 定 在 一 起 ， 描 述 了 
板 一 级 的 硬件 特征 。 

在 以 上 3 部 分 中 ，1 和 2 基本 都 可 以 仍然 是 通用 的 驱动 了 ， 也 就 是 说 ，Codec 驱动 认为 自己 
可 以 连接 任意 CPU， 而 CPU 的 TS、PCM EÈ AC '97 接口 对 应 的 平台 驱动 则 认为 自己 可 以 连接 任 
意 符 合 其 接口 类 型 的 Codec, KA 3 是 不 通用 的 ， 由 特定 的 电路 板 上 具体 的 CPU 和 Codec 确定 ， 
因此 它 很 像 一 个 插座 ， 上 面 插 上 了 Codec 和 平台 这 两 个 插头 。 

在 以 上 三 部 分 之 上 的 是 ASoC 核心 层 ， 由 内 核 源 代码 中 的 sound/soc/soc-core.c 实现 ， 查 看 其 
源 代码 发 现 它 完全 是 一 个 传统 的 ALSA 驱动 。 因 此 ， 对 于 基于 ASoC 架构 的 声卡 驱动 而 言 ，alsa-lib 
以 及 ALSA 的 一 系列 utility 仍然 是 可 用 的 ， 如 amixer、aplay 均 无 需 针 对 ASoC 进行 任何 改动 。 而 
ASoC 的 用 户 编程 方法 也 与 ALSA 完全 一 致 。 

内 核 源 代码 的 Documentation/sound/alsa/soc/ 目 录 包 含 了 ASoC 相关 的 文档 。 


17.5.2 ASoC Codec 驱动 


在 ASoC 架构 下 ，Codec 驱动 负责 如 下 工作 。 
(1) Codec DAI (Digital Audio Interfaces) 和 PCM 配置， 由 结构 体 snd soc dai〔( 如 代码 清 
单 17.28) 来 描述 ， 形 容 playback、capture 的 属性 以 及 DAI 接口 的 操作 。 
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代码 清单 17.28 DAI 结构 体 snd_soc_dai 定义 
struct snd soc dai f 
/* DAT 的 描述 */ 
char *name; 
unsigned int id; 


J DAT ell ae 


iL 

2 

3 

4 

5 unsigned char type; 

6 

3i 

8 int (*probe) (struct platform device *pdev, 





INUX 


oo 
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9 struct snd soc dai *dai); 
0 void (*remove) (struct platform device *pdev, 
d struct snd soc dai *dai); 
2 int (*suspend) (struct platform device *pdev, 
3 struct snd soc dai *dai); 
4 int (*resume) (struct platform device *pdev, 
5 struct snd soc dai *dai); 
6 
7 /OD 
8 usn eho soe roa eosin 
9 We eol mo elem OI S 
20 
21 /* DAI 的 能 力 */ 
22 Struct snd soc pcm stream capture; 
23 Struct snd soc pcm stream playback; 
24 
25 /* DAT iaiT EE */ 
26 struct snd pcm runtime *runtime; 
29h struct snd- soc codec "codec; 
28 unsigned int active; 
219 unsigned char pop wait:1; 
30 void *dma data; 
SL 
32 /* DAI 私有 数据 */ 
33 void *private_data; 
34 Y; 





$E 22. 23 行 的 snd soc pem stream 类 型 成 员 capture. playback 分 别 描述 录音 和 放 音 的 能 力 ， 
snd_soc_pcm_stream 结构 体 主 要 包含 formats.rates.rate min.rate max.channels min.channels max 
这 几 个 字段 。 
(2) Codec IO 操作 、 动 态 音 频 电源 管理 以 及 时 钟 、PLL S28 
代码 清单 17.28 中 第 27 行 的 snd_soc_codec 结构 体 是 对 Codec 本 身 1O 控制 以 及 动态 音频 电 
源 管 理 (Dynamic Audio Power Management, DAPMO 的 描述 。 它 描述 TC. SPI 或 AC '97 如 何 读 
© Codec 寄存 器 并 容纳 DAPM 链表 ， 其 定义 如 代码 清单 17.29， 核 心 成 员 为 read(). write(). 


hw_write()、hw_read()、dapm_widgets、dapm paths 等 。 
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代码 清单 17.29 snd soc codec 结构 体 定 义 


T ESI GIISMES meas o CN COEG 

2 char *name; 

3 struct module *owner; 

4 struct mutex mutex; 

5 

6 [5 ceullisexeike 

7 int. (*set bias level)(struct snd soc codec *, 

8 enum snd soc bias level level); 
9 

10 J/ 5? nm 

Mt Struck sud card "card: 

12 struct snd.ac97. *ac9T1; J* for ad-Hoo ac9 7 devices. */ 
WS unsigned int active; 

14 unsigned int pcm devs; 

15 void *private_data; 
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ale 


16 

1g) I eode NEA 

18 vore *conbtrol datar 7* codec control (oe Sie data f7 

19 unsigned int (*read) (struct snd soc codec *, unsigned int); 
20 int (*write) (struct snd soc codec *, unsigned int, unsigned int); 
2 int (*display register) (struct snd soc codec *, char *, 

22 Size t, unsigned int); 

29 hw write t hw write; 

24 hw read t hw read; 

TE void *reg cache; 

26 short reg cache size; 

29) short reg cache step; 

28 


29 /* dapm */ 
30 struct list head dapm widgets; 
SL struct list head dapm paths; 


32 enum snd soc bias level bias level; 

33 enum snd_soc_bias_level suspend bias_level; 
34 struct delayed work delayed_work; 

25 

36 /* codec DAI's */ 

37 Srruct smel soc dai "dal: 

38 unsigned int num dai; 

CON 





















































代码 清单 17.28 中 第 19 行 的 snd. soc. dai ops 则 描述 该 Codec 的 时 钟 、PLL 以 及 格式 设置 ， 
主要 包括 set_sysclk()、set_pll(、set_clkdiv()、set_fmt() 等 成 员 函 数 ， 其 定义 如 代码 清单 17.30。 



































代码 清单 17.30 snd soc dai ops 结构 体 定义 








Wore rS nd ES oC elut oe i 

2 /* DAI Mere */ 

E int (*set sysclk) (struct snd soc dai *dai, 

4 age (els Lei ohare susp: Areo ine luas) p 

5 am Setups (Sable eo oe els oll 

6 int pll id, unsigned int freq in, unsigned int freq out); 
7 mae (set CL ty (stver Snel poe cai cals int Giy el Tag 8x) 
8 

9 /* DAI 格式 配置 */ 

0 int (*set fmt) (struct snd soc dai *dai, unsigned int fmt); 

1 inb (set bim sebot)tetruüuct shd soc dal *dar, 

2 unsigned int mask, int slots); 

3 int «**set Ltristate)(struct snd sos dat *dadx, iunt tristate); 

4 

5 /* 数字 静音 */ 

6 int (*digital mute) (struct snd soc dai *dai, int mute); 

1. »g 





(3) Codec 的 mixer 控制 。 

ASoC 中 定义 了 一 组 宏 来 描述 Codec 的 mixer 控 币 
存 器 进行 绑 定 ， 主 要 包括 : 

SOC SINGLE(xname, reg, shift, mask, invert) 


SOC DOUBLE(xname, reg, shift left, shift right, mask, invert) 
SOC ENUM SINGLE(xreg, xshift, xmask, xtexts) 


例如 ， 对 于 宏 SOC SINGLE ifj zi, 参数 xname 是 mixer 的 名 字 (如 “Playback Volume"), reg 




















m 


,这 组 宏 可 以 方便 地 将 mixer 名 和 对 应 的 寄 
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是 控制 该 mixer 的 寄存 器 ，shift 对 应 寄存 器 内 的 位 ，mask 是 进行 操作 时 的 屏蔽 位 ，invert 表明 是 


否 倒序 或 翻转 。 





i 

















(4) Codec 音频 操作 。 

在 ASoC 驱动 的 Codec 部 分 ， 也 需要 关心 音频 流 开始 采集 或 播放 时 的 一 些 动 作 ， 如 
hw_params()、hw_free()、prepare()、trigger(0) 这 些 操 作 ， 不 过 与 原始 ALSA 不 同 的 是 ， 在 Codec 
驱动 的 这 些 函 数 中 ， 不 关心 CPU 端 ， 而 只 关心 Codec 本 身 ， 由 结构 体 snd soc ops 描述 ， 如 代码 





青 单 17.31 所 示 。 





SN STI 






































代码 清单 17.31 snd soc ops 结构 体 定义 


SS COD! SE 


int (*startup) (struct snd pcm substream *); 
void (*shutdown) (struct snd pcm substream *); 


dL 
2 
3 
4 dae 
E ( 
6 ( 
7 ( 


对 


ASoC 的 主要 维 
成 员 ， 因 此 从 内 核 上 
Analog Devices 也 是 该 目录 源 代 码 的 主要 贡献 者 。 


*hw params) (struct snd pcm substream *, struct snd pcm hw params *); 
*hw free) (struct snd pcm substream *); 

*prepare) (struct snd pcm substream *); 

*trigger) (struct snd pcm substream *, int); 








护 者 Mark Brown Cbroonie(gopensource.wolfsonmicro.com?) 是 Wolfson 公司 的 














的 drivers/sound/soc/codecs 下 容易 发 现 Wolfson 系列 Codec 芯片 的 驱动 ， 此 外 ， 




















17.5.3 ASoC 平台 驱动 









































首先 ， 在 ASoC 平台 驱 动 部 分 ， 同 样 存 在 着 Codec 驱动 中 的 snd soc dai. snd soc dai ops. 











snd_soc_ops 这 3 个 结构 体 的 实例 用 于 描述 DAI 和 DAI 上 的 操作 , 不 过 不 同 的 是 , 在 平台 驱动 中 ， 
它们 只 描述 CPU 相关 的 部 分 而 不 描述 Codec。 除 此 之 外 ， 在 ASoC 平台 驱动 中 ， 必 须 实现 完整 的 


DMA 了 驱动， 
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即 传统 ALSA 的 snd pem ops 结构 体 成 员 函 数 trigger0、pointer0 等 。 因 此 ASoC F 
























































区 动 通常 由 DAI 和 DMA 两 部 分 组 成 ， 如 代码 清单 17.32 所 示 。 














{ 


} 


X6. XO. od OR S as Ov NY CP 


{ 


} 


{ 


} 





OD. ep e y R O WE = TE A bg E E C 

















代码 清单 17.32 ASoC 平台 驱动 的 组 成 


/* DAI 部 分 */ 


static int xxx i2s set dai fmt(struct snd soc dai *cpu dai, 


unsigned int fmt) 


static int xxx i2s startup(struct snd pcm substream *substream) 


static int xxx i2s hw parans (struct snd pcm substream *substream, 


struct snd pcm hw params *params) 
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e 
Q9 

19 static void xxx i2s shutdown(struct snd pcm substream *substream) ® 

2 

21 

22 

23 

24 static int xxx i2s probe(struct platform device *pdev, 

25 struct snd soc dai *dai) 

Zio 

27 

DIGNE 

2:9 

30 static void xxx i2s remove(struct platform device *pdev, 

a stouet end soc dac dat) 

32. 

33 

34 Fg 

35 

36 static int xxx i2s suspend(struct platform device *dev, 

ie Struck snd soc dad *dai) 

Si. 4 

29 

40 } 

41 

42 static int xxx i2s resume(struct platform device *pdev, 

43 Sema snel soe Cei Sce) 

44 { 

45 

46 } 

47 

48 struct snd soc dai xxx i2s dai - f 

49 .name = "xxx-i2s", 

50 paio 97. 

52 .type = SND SOC DAI I2S, 

52 .probe = xxx i2s probe, 

53 .remove - xxx i2s remove, 

54 .Suspend = xxx i2s suspend, 

SS .resume = xxx i2s resume, 

56 .playback = ( 

5r .channels min = 1, 

58 .channels max - 2, 

n .rates = XXX I2S RATES, 

60 .formats - XXX I2S FORMATS,], 

61 .capture = ( 

62 .channels min = 1, 

63 .channels max - 2, 

64 .rates = XXX I2S RATES, 

65 .formats - XXX I2S FORMATS,], 

66 .ops - (1 

67 .Startup cs Moxox blo 

68 .Shutdown = xxx i2s shutdown, 

69 .hw params - xxx i2s hw params,], 

70 .dai ops - ( 

qA .Set fmt - xxx i2s set dai fmt, 

412 ), 

UE HE, 
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74 
TES 


KO. XOLOAQ ACC XO Ao Aen E AOL: OO 90-60. DU- "OO OO" XE o Ros cse 
CD CUu "Qu oo OP de e dope Mer E rte te aoo UB Ue DES ADOOS co 
GO X dec 


C C oc 
Oo On 4 


eO Oo 
coo N 


e 
ie coo ced ED 





No Mo UD 
i: oj, e 


NO NO NO ND 
oO OC! £A C 





N N 
oo -J 


/* DMA 部 分 */ 


Statie 


{ 


statio 


; 


static 


Statio 


static 


Starr 


static 


static 





STACIE 


IGI 


void bf5xx dma irq(void *data) 
struct snd pcm substream *pcm = data; 


snd pcm period elapsed (pom); 


const struct snd pcm hardware xxx pcm hardware = { 


int xxx pcm hw params (struct snd pcm substream *substream, 
struct snd pcm hw params *params) 


snd pcm lib malloc pages(substream, size); 


return 0; 


int xxx pcm hw free(struct snd pcm substream *substream) 


snd pcm lib free pages (substream); 


return 0; 


int xxx pcm prepare(struct snd pcm substream *substream) 


int xxx pom trigger (struct snd pcm substream *substream, int cmd) 


snd pcm uframes t xxx pcm pointer(struct snd pcm substream *substream) 


int xxx pcm open(struct snd pcm substream *substream) 


int xxx pcm mmap(struct snd pcm substream *substream, 


Btruct vm area struct yie) 


snd pcm ops xxx pcm i2s ops - ( 
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eoe 





29 .open = XXX pcm open, 

30 g ak exe dL ndup en en abexeitc. l.p 
S .hw params = XXX pcm hw params, 
322 .hw free = XXX pcm hw free, 
95 .prepare = XXX pcm prepare, 
34 .trigger — XXX pom trigger, 
S5 .pointer = XXX pcm pointer, 
36 .mmap = XXX pcm mmap, 

EFE: 


17.5.4 ASoC AR 3 jJ 

ASoC 板 驱 动 直接 与 板 对 应 ， 对 于 一 块 确定 的 电路 板 ， 其 SoC 和 Codec 都 是 确定 的 ， 因 此 板 
驱动 将 ASoC Codec 驱动 和 CPU 端的 平台 驱动 进行 绑 定 ， 这 个 绑 定 用 数据 结构 snd_soc_dai link 
省 述 ， 其 定义 如 代码 清单 17.33 所 示 。 




































































































































































代码 清单 17.33 snd soc dai link 结构 体 
struct snd soc dai link ( 


char *name; /* Codec name */ 


char *stream name; /* Stream nàme */ 


Struct sndiri soc dal *codec dai 


i 

2 

3 

4 

3) FA tU 
6 

7 struct snd soc dai *cpu dai; 
8 

9 


/* 板 流 操作 */ 


struct snd soc ops *ops; 


/* codec/machine 特定 的 初始 化 */ 


anb (slart) tetrur snc soc le el 





STEEL 


DT oC yy 
ONES CCCII CI. 
7); 


除 此 之 外 ， 板 驱动 还 关心 一 些 板 特定 的 硬件 操作 ， 因 此 也 存在 一 个 snd soc ops 的 实例 。 

在 板 驱 动 的 模块 初始 化 函数 过 platform_ device_add0 注 册 一 个 名 为 “soc-audio” 的 
platform 设备 ， 这 是 因为 soc-core.c 注册 了 一 个 名 为 “soc-audio” 的 platform 驱动 ， 因 此， 在 板 驱 
动 中 注册 “soc-audio” 设 备 会 引起 两 者 的 匹配 ， 从 而 引发 一 系列 的 初始 化 操作 。 尤 其 值得 一 提 的 
是 ,“soc-audio” 设 备 的 私有 数据 需要 为 一 个 snd_soc_device 的 结构 体 实 体 ， 因 此 一 个 板 驱 动 典型 
的 模块 加 载 函 数 将 形 如 代码 清单 17.34。 
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代码 清单 17.34 ASoC 板 驱动 模块 加 载 函数 及 其 访问 的 数据 结构 
Statie Se uselfxexel celsa ln uO el 
2 .name = "codecy", 
9 .Stream name = "CODECY", 
4 exeo eur e €cpuüux a2. (elu. 
5 .codec_dai = &codecy_dai, 
6 .OPS = &cpux codecy ops, 
p 
8 
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9 static struct snd soc machine cpux codecy - ( 
.name = "cpux codecy", 

.probe - cpux probe, 

.dai link -» &cpux codecy dai, 

.num links = 1, 


Static struct snd soc device cpux codecy snd devdata = { 
.machine = &cpux codecy, 


DU qo S x a be BÀ Ue 
Í— 


.platform - &cpux i2s soc platform, 





9 .Codec dev = &soc codec dev codecy, 
20) j£ 
21 
22 static struct platform device *cpux codecy snd device; 
28 
2:2 yt aee aie abe Ea GL Gy e DIESES SV OG GL) 
2E 
26 int ret; 
27 
28 cpux codecy snd device = platform device alloc("soc-audio", -1); 
29 if (!cpux codecy snd device) 
30 return -ENOMEM; 
Sut 
92 platform set drvdata(cpux codecy snd device, &cpux codecy snd devdata); 
33 cpux codecy snd devdata.dev = &cpux codecy snd device-»dev; 
34 ret = platform device add(cpux codecy snd device); 
35 
36 if (ret) 
37 platform device put (cpux codecy snd device); 
38 
9o return ret; 
40 } 


41 module init(cpux codecy init); 
上 述 代 码 中 访问 的 snd soc device 是 对 一 个 ASoC 设备 的 整体 封装 ， 因 此 其 中 包括 了 封装 板 
的 snd_ soc machine(machine 成 员 )、 封装 ASoC Codec 设备 用 的 snd_soc_codec_deviceCcodec_dev 
成 员 )， 封 装 ASoC 平台 设备 用 的 snd_soc_platform (platform 成 员 )。 

ASoC 驱动 的 Codec、 平 台 和 板 驱 动 是 3 个 独立 的 内 核 模块 ， 在 板 驱 动 中 ， 对 ASoC Codec 设 








































































































































































































备 \、ASoC 平台 设备 实例 的 访问 都 通过 被 ASoC Codec 驱动 或 ASoC 平台 驱动 导出 的 全 局 变量 执行 ， 
这 使 得 ASoC 难以 同时 支持 两 个 以 上 的 Codec。 至 本 书 截 稿 时 ，ASoC 的 其 中 一 个 维护 者 Liam 
Girdwood (lrg@slimlogic.co.uk)〉 正 在 添加 ASoC 对 多 Codec 的 支持 。 


1 7.6 S3C6410-WM9714 ASoC 驱动 实例 


LDD6410 开发 板 上 为 S3C6410 的 AC'97 接口 上 连接 了 Wolfson 公司 的 WM9714 Codec i5 
片 ， 其 硬件 连接 如 图 17.6 所 示 。WM9714 芯片 主要 外 接 了 Microphone. Line in 模拟 输入 和 
Headphone 模拟 输出 。 而 在 数字 接口 方面 ， 与 S3C6410 CPU 的 连接 包含 了 AC-Link 总 线 上 必 
要 的 信号 。 
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WM9714 是 一 款 比 较 复 杂 的 Codec 芯片 ， 其 与 AC'97 22 兼容 。 内 部 集成 了 HiFi 立体 声 
ADC/DAC, AUX ADC/DAC 和 用 于 话音 的 Voice ADC/DAC， 同 时 包含 数 个 mux 和 mixer 以 及 增 
益 调节 ， 在 使 用 该 芯片 上 ， 读 懂 数 据 手 册 中 的 “Audio Paths Overview” 即 音频 路 径 图 非常 关键 。 

LDD6410 开发 板 上 ASoC 驱动 的 3 部 分 分 别 是 。 

(1) Codec 驱动 。 由 内 核 源 代 码 sound/soc/codecs/wm9713.c 实现 。 

(2) 平台 驱动 。 由 内 核 源 代码 sound/soc/s3c/s3c-ac97.c 实现 S3C6410 CPU 端的 DAI 驱动 ， 
sound/soc/s3c/s3c-pcm.c 实现 CPU 端的 DMA 驱动 。 

(3) 板 驱 动 。 由 内 核 源 代码 sound/soc/s3c/smdk6410 wm9713.c 实现 ， 它 将 第 1 部 分 和 第 2 部 
分 进行 绑 定 。 

sound/soc/codecs/wm9713.c 超过 1300 行 ， 支 持 WM9713、WM9714， 主 要 定义 了 一 系列 的 
mixer 控制 、DAPM、AC97 底层 读 写 、 时 钟 /PLL 控制 以 及 snd_soc_ops 的 成 员 函 数 。 我 们 不 可 能 
一 一 列举 ， 这 里 仅 抽 取 其 核心 一 观 ， 如 代码 清单 17.35。 






































































































































































































































代码 清单 17.35 WM9713/4 的 ASoC Codec 驱动 





1 /* 一 系列 的 mixer 控制 */ 
2 static const struct soc enum wm9713 enum[] = { 
3 SOC ENUM SINGLE(AC97 LINE, 3, 4, wm9713 mic mixer), /* record mic mixer 0 */ 
4 otio 
S }; 
6 
7 static const struct snad kcontrol new wm9713 snd ac97 controls[] = ( 
8 SOC DOUBLE ("Speaker Playback Volume", AC97 MASTER, 8, 0, 31, 1), 
9 «V 
Q Jg 
F 
2 /* add non dapm controls */ 
3 static int wm9713- add controls(struüct send soc -codeo oe 
4 q 
i eh EE 
6 
F for (i = 0; i « ARRAY SIZE(wm9713 snd ac97 controls); i--) f 
8 err = snd ctl add(codec-»card, 
9 snd soc cnew(&wm9713 snd ac97 controls[i], 
20 codec NULLEI? 
2 Msc SM (OD) 
22 return err; 
23 j 
24 return 0; 
2:5 
26 
2y 
28 static const struct snd kcontrol new wm9713 hpl mixer controls[] -» ( 
AO is 
30 ); 
31 
32 /* Right Headphone Mixers */ 
33 static const struct snd kcontrol new wm9713 hpr mixer controls[] -» ( 
94s Eros. 
CON 
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© 
Q9 

36 ® 

37 /* 一 系列 的 dapm 控制 */ 

38 static const struct snd soc dapm widget wm9713 dapm widgets[] -» ( 

39 SND SOC DAPM MUX ("Capture Headphone Mux", SND SOC NOPM, O0, O0, 

40 &wm9713 hp rec mux controls), 

AUS 

42 }; 

43 

44 static const struct snd soc dapm route audio map[] = ( 

Als. y Miswcie dede mieken wy 

46 ("Left HP Mixer", "PC Beep Playback Switch", "PCBEEP"], 

47 6v 

48 ); 

49 

50 static int wm9713 add widgets(struct snd soc codec *codec) 

Sui. -W 

52  snd soc dapm new controls(codec, wm9713 dapm widgets, 

53 ARRAY SIZE (wm9713 dapm widgets)); 

54 

5 snd soc dapm add routes (codec, audio map, ARRAY SIZE (audio map)); 

56 

57 snd soc dapm new widgets (codec); 

ONE min 

SOR 

60 

61 /* io. BB. NOXAE */ 

62 static unsigned int ac97 read(struct snd soc codec *codec, 

63 unsigned int reg) 

(uU 4 

(dis Keen 

66 ] 

67 

68 static int ac97 write(struct snd soc codec *codec, unsigned int reg, 

69 unsigned int val) 

30 d 

gin Ns 

PI 

T3 

74 static int wm9713 set dai pll(struct snd soc dai *codec dai, 

TE int pll id, unsigned int freq in, unsigned int freq out) 

JO. x 

3 Der 

"a 

FiS) 

80 static int wm9713 set dar fmt(struct snd soe dai *codec dai, 

81 unsigned int fmt) 

GONE 

83 

84 } 

85 

86 /* 关于 音频 流 的 操作 snd_soc ops */ 

87 static int wm9713 pcm hw params (struct snd pcm substream *substream, 

88 struct snd pcm hw params *params) 

GIONE 

90 
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91 
92 
93 static void wm9713 voiceshutdown (struct snd pcm substream *substream) 
94 
96 
96 
97 
98 static int ac97 hifi prepare(struct snd pcm substream *substream) 
29 
00 
uL 3 
02 
03 static int ac97 aux prepare(struct snd pcm substream *substream) 
04 ( 
DES 
06 ] 
07 
Qe J^ ix 5 
109 struct snd soc dai wm9713 dai[] = ( 
om 
1 .name - "AC97 HiFi", 
2 .type = SND SOC DAI AC97 BUS, 
3 .playback = ( 
4 .Stream name - "HiFi Playback", 
5 .channels_min = 1, 
6 .channels_max = 2, 
di .rates = WM9713 RATES, 
8 .formats - SNDRV PCM FMTBIT S16 LE,], 
9 .capture - ( 
20 .Stream name - "HiFi Capture", 
2 .channels min = 1, 
22 .channels max = 2, 
23 .rates = WM9713 RATES, 
24 .formats = SNDRV PCM FMTBIT S16 LE,], 
20 TOPS = x 
26 .prepare - ac97 hifi prepare,], 
27 .daiops - ( 
28 .Set clkdiv = wm9713 set dai clkdiv, 
2:9 .Set pll - wm9713 set dai pll,], 
ENT 
Sub. x 
32 .name = "AC97 Aux", 
33 .playback - ( 
34 .Stream name - "Aux Playback", 
25 .channels min = 1, 
36 .channels max = 1, 
37 .rates = WM9713 RATES, 
38 .formats = SNDRV PCM FMTBIT S16 LE,], 
S!) stes e x 
40 .prepare - ac97 aux prepare,], 
AT Glad OI S 
42 .Set clkdiv - wm9713 set dai clkdiv, 
43 .Set pll = wm9713 set dai pll,], 
44 ], 
45 { 
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46 .name = "WM9713 Voice", 

Are 

48 ], 

49 ); 

150 EXPORT SYMBOL GPL(wm9713 dai); 

Si 

52 /* snd soc codec device 成 员 */ 

53 static int wm9713 soc suspend(struct platform device *pdev, 


oo 


54 pm message t state) 
55 
56 
E 
58 
59 static int wm9713 soc resume(struct platform device *pdev) 
60 
61 
62 
63 
64 static int wm9713 soc probe(struct platform device *pdev) 
65 
66 struct snd soc device *socdev - platform get drvdata (pdev); 





o^ etruct sd soc codec Coders 

68 int ret = 0, reg; 

69 

AU ERO 

71 codec-»name = "WM9713"; 

72 codec-»owner = THIS MODULE; 

73 codec-»dai = wm9713 dai; 

74 codec-»num dai = ARRAY SIZE (wm9713 dai); 
75 codec-»write - ac97 write; 

76 codec-»read = ac97 read; 

77 codec-»5set bias level = wm9713 set bias level; 
78 INIT LIST HEAD(&codec-»dapm widgets); 

79 INIT LIST HEAD(&codec-»dapm paths); 


80 

81 ret = snd soc new ac97 codec(codec, &soc ac97 ops, 0); 
QU. ax aee «e (0n) 

83 goto codec err; 

84 


85 /* register pcms */ 

86 ret = snd soc new pcms (socdev, SNDRV DEFAULT IDX1, SNDRV DEFAULT STR1); 
(Uy ase ases xw (09) 

88 goto pcm err; 

89 

90 

91 

92 wm9713 add controls (codec); 

93 wm9713 add widgets (codec); 

94 ret - snd soc register card(socdev); 

Dog m 

9 y 

97 

98 static int wm9713 soc remove(struct platform device *pdev) 
SION 

200 
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201 snd soc dapm free (socdev); 
202 snd soc free pcms (socdev); 
203 snd soc free ac97 codec(codec); 


2042 s 

205 return 0; 

208-3 

207 

208 struct snd soc codec device soc codec dev wm9713 - ( 
209 .probe - wm9713 soc probe, 

210 .remove - wm9713 soc remove, 

211 .suspend - wm9713 soc suspend, 

212 .resume - wm9713 soc resume, 

Zero 


214 EXPORT SYMBOL GPL(soc codec dev wm9713); 

sound/soc/s3c/s3c-ac97.c 实现 CPU 3i AC97 DAI 的 驱动 ， 会 导出 snd soc dai 结构 体 的 实例 
sS3c ac97 dai. sound/soc/s3c/s3c-pcm.c 实现 CPU 端的 DMA 驱动 ， 其 核心 如 代码 清单 17.36， 它 也 
会 导出 snd_soc_platform 结构 体 的 实例 s3c24xx_soc_platform。 















































代码 清单 17.36 S3C6410 平台 驱动 DMA 进行 PCM 流 操作 














E Static const struct snd pcm hardware s3c24xx pcm hardware - ( 
2 CINEO = SNDRV_PCM_INFO_INTERLEAVED | 

3 SNDRV PCM INFO PAUSE | 

4 SNDRV PCM INFO RESUME | 

5 SNDRV_PCM_INFO_BLOCK_TRANSFER | 

6 SNDRV_PCM_INFO_MMAP | 

7 SNDRV PCM INFO MMAP VALID, 

8 c d eimi etel = SNDRV PCM FMTBIT S16 LE | 

9 SNDRV PCM FMTBIT U16 LE | 

0 SNDRV PCM FMTBIT U8 | 

i SNDRV PCM FMTBIT S24 LE | 

2 SNDRV PCM FMTBIT S8, 

3 .channels min = 2, 

4 .channels_max = 2, 

5 .buffer_bytes_max = 128*1024, 

6 .period bytes_min = PAGE_SIZE, 

y .period bytes max = PAGE SIZE*2, 

8 .periods min = 2, 

9 .periods_max = 128, 

20 stifto Size = 32, 

2i Jg 

22 

23 static int s3c24xx pcm hw params(struct snd pcm substream *substream, 
24 struct snd pcm hw params *params) 

29 

26 

2 

28 

29 static int s3c24xx pcm hw free(struct snd pcm substream *substream) 
30 

Sl 

32 

33 

34 static int s3c24xx pcm prepare (struct snd pcm substream *substream) 
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SIRE Q 

36 

Su 

ey 

39 static int s3c24xx pcm trigger(struct snd pcm substream *substream, int cmd) 

4 0 í 

41 MAA 

42 switch (cmd) ( 

43 case SNDRV PCM TRIGGER RESUME: 

44 ye 

45 Case SNDRV_PCM TRIGGER START: 

46 case SNDRV PCM TRIGGER PAUSE RELEASE: 

47 prtd-»state |= ST RUNNING; 

48 S3c2410 dma ctrl(prtd-»params-»channel, S$3C2410 DMAOP START); 

49 break; 

50 

SA E. 

52 } 

pop T 

54 } 

o5 

56 static snd pcm uframes t 

57 S3c24xx pcm pointer(struct snd pcm substream *substream) 

58 

59 

60 return bytes_to frames (substream->runtime, res); 

61 

62 

63 static int s3c24xx pcm open(struct snd pcm substream *substream) 

64 

65 

66 return 0; 

67 

68 

69 static int s3c24xx pcm close(struct snd pcm substream *substream) 

70 

HL 

e 

973) 

74 static int s3c24xx pcm mmap(struct snd pcm substream *substream, 

NIE struct u area struck *vma) 

JO. 4 

EN 

78 return dma mmap writecombine(substream-»pcm-»card-»dev, vma, 

79 runtime-»dma area, 

80 runtime-»dma addr, 

81 runtime-»dma bytes); 

Go g 

83 

84 static struct snd pcm ops s3c24xx pcm ops - ( 

85 . open = s3c24xx_pcm_open, 

86 .close = sS3c24xx pcm close, 

87 ire cti = ewel oen aoa el 

88 .hw params = s3c24xx pcm hw params, 

89 .hw free = s3c24xx pcm hw free, 
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90 .prepare = s3c24xx pcm prepare, 
SiT .trigger = s3c24xx pcm trigger, 
92 .pointer = s3c24xx pcm pointer, 
93 . mmap = S3c24xx pcm mmap, 
94 }; 
95 
96 static int s3c24xx pcm preallocate dma buffer(struct snd pcm *pcm, int stream) 
9T (1 
98 n 
99  buf-»area = dma alloc writecombine (pcm-»card-»dev, size, 
00 &buf-»addr, GFP KERNEL); 
01 if (!buf-»area) 
02 return -ENOMEM; 
03 buf-»bytes = size; 
04 return 0; 
9s 
06 
07 static void s3c24xx pcm free dma buffers(struct snd pcm *pom) 
(ET 
09 n 
0 for(stream-SNDRV PCM STREAM PLAYBACK;stream«-SNDRV PCM STREAM CAPTURE; stream++) { 
1l substream = pcm-»streams[stream].substream; 
2 if (!substream) 
3 continue; 
4 
5 buf = &substream-»dma buffer; 
6 if (!buf-»area) 
ki continue; 
8 
9 dma free writecombine (pcm-»card-»dev, buf-»bytes, 
20 buf-»area, buf-»addr); 
21 buf-»area = NULL; 
22 buf-»addr = 0; 
23- 
24 } 
25 
26 static u64 s3c24xx pcm dmamask = DMA 32BIT MASK; 
2 
28 static int s3c24xx pcm new(struct snd card *card, 
DONE CIUCCNESDdE ORO C d snemem TIU) 
SONT 
3 
32 
33 if (dai-»playback.channels min) ( 
34 ret = s3c24xx pcm preallocate dma buffer (pcm, 
Si SNDRV PCM STREAM PLAYBACK); 
36 if (ret) 
Bi goto out; 
3e j 
38) 
40 if (dai-»capture.channels min) ( 
41 ret = s3c24xx pcm preallocate dma buffer (pom, 
42 SNDRV PCM STREAM CAPTURE); 
43 if (ret) 
44 SOCO OUt, 
438 IINUX, 
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45 ] 

GE 

47 return ret; 

48 ] 

49 

150 struct snd soc platform s3c24xx soc platform - ( 
51 .name = "s3c24xx-audio", 

D NETS CITRODS = &s3c24xx pcm ops, 

53 .pcm new = s3c24xx pcm new, 

54 .pcm free = sS3c24xx pcm free dma buffers, 
S. 5 

56 


157 EXPORT SYMBOL GPL(s3c24xx soc platform); 

sound/soc/s3c/smdk6410 wm9713.c 的 形式 与 代码 清单 17.33 基本 相同 ， 它 将 前 述 Codec 和 和 平 
台 驱 动 中 导出 的 symbol 绑 定 在 一 起 ， 并 在 模块 加 载 函 数 中 注册 一 个 名 为 “soc-audio” 的 platform 
设备 。 


17.7 =- 


音频 设备 接口 包括 PCM, IIS 和 AC97 等 , 分 别 适 用 于 不 同 的 应 用 场合 。 针对 音频 设备 , Linux 
内 核 中 包含 了 3 类 音频 设备 驱动 框架 ，OSS、ALSA 和 ASoC, OSS 包含 dsp 和 mixer 字符 设备 接 

， 在 用 户 空间 的 编程 中 ， 完 全 使 用 文件 操作 ; ALSA 后 者 以 card 和 组 件 (PCM, mixer 等 ) 为 
主线 , 在 用 户 空间 的 编程 中 不 使 用 文件 接口 而 使 用 alsalib; ASoC 则 是 ALSA 在 SoC 方面 的 演变 ， 
它 建立 在 ALSA 之 上 ,将 ALSA 驱动 中 CPU 相关 的 代码 和 Codec 相关 的 代码 进行 了 分 离 。 
在 音频 设备 驱动 中 ， 几 乎 必须 使 用 DMA， 而 DMA 的 缓冲 区 会 被 分 割 成 一 个 一 个 的 段 ， 
每 次 DMA 操作 进行 其 中 的 一 段 OSS 驱动 的 阻塞 读 写 具有 流 控 能 力 , 在 用 户 空 间 不 需要 进行 
流量 方面 的 定时 工作 , 但 是 它 需 要 及 时 地 写 (播放 ) 和 读 ( 录 音 ), 以 免 出 现 缓冲 区 的 underflow 
或 overflow. ALSA 和 ASoC 的 流 控 则 由 ALSA 的 核心 层 处 理 , 底层 驱动 仅 以 trigger()、pointer() 
等 方法 进行 配合 。 
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8 Jii (PDA)、 手 机 等 多 采用 TET 显示 器 件 ， 支持 彩 

















在 多 媒体 应 用 的 推动 下 ， 彩 色 LCD 越 来 越 多 地 应 用 到 了 骨 入 式 系统 


色 图 形 界面 ， 









































中 
能 显示 图 片 并 进行 视频 媒体 播放 。 帧 缓冲 〈Framebuffer) 是 Linux 为 显示 
股 备 提供 的 一 个 接口 ， 它 允许 上 层 应 用 程序 在 图 形 模式 下 直接 对 显示 缓冲 

















区 进行 读 写 操作 。 











本 章 主 要 讲解 帧 缓冲 设备 Linux 驱动 的 架构 及 编程 方法 。 
18.2 节 讲 解 了 帧 缓冲 设备 























18.1 节 讲 解 了 LCD 的 底层 硬件 操作 原理 ， 
的 概念 及 驱动 中 的 重要 数据 结构 和 函数 。 
18.3 节 讲 解 了 帧 缓冲 设备 驱动 的 整体 结构 ， 
















































































18.4—18.8 节 分 别 讲解 了 











帧 缓冲 设备 的 几 个 重要 函数 , 18.3 节 和 18.4 一 18.8 节 的 内 容 是 整体 与 部 分 





的 关系 。 














18.9 节 讲 解 了 Linux 帧 缓冲 设备 用 户 











空间 的 访问 方法 ， 并 对 




















Qt/Embedded, MiniGUI, MicroWindows, Android 等 GUI 进行 了 简单 的 


介绍 。 


18.10 "Uf f S3C6410 LCD 控制 器 设备 可 
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1 8. Í LCD 硬件 原理 


时 驱动 方式 可 分 为 静态 驱动 、 简 单 矩 阵 驱 动 以 及 主动 

















Fg t i t 
矩阵 驱动 3 种 。 




















I 成 的 显示 器 称 为 LCD， 依 于 
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中 ， 简 单 矩阵 型 又 可 再 细 分 扭转 向 列 型 CTN) 和 超 扭 转 式 向 列 型 (STN) 两 
种 ， 而 主动 矩阵 型 则 以 薄膜 式 晶 体 管 型 CTFTO 为 主流 。 表 18. 列 出 了 TN. STN 和 TFT 显示 
AS HI 
表 18.1 TN. STN 和 TFT 显示 器 的 区 别 
类 zl TN STN TFT 
原理 液晶 分 子 ， 扭 转 90 扭转 180^ —270^ 液晶 分 子 ， 扭 转 90° 
村 性 Bi. MC 3265 : 彩色 (1667 万 色 ), 可 媲美 CRT 
FHE 黑白 、 单 色 低 对 比 、 彩 色 ， 低 对 比 显示 器 的 全 彩 ， 高 对 比 
动画 显示 E 是 
视 30" 以 下 “以 下 80° 以 下 
面板 尺寸 1 一 3 英寸 英寸 37 英寸 
其 他 种 类 的 LCD 都 以 TN 型 为 基础 改进 而 得 。TN 


TN 型 液晶 显 


型 LCD 显示 质 





示 技 术 是 LCD 中 最 基本 的 ， 
H, 色彩 单一 ， 对 比 度 


























显示 ， 如 电子 表 
的 显示 原理 
则 可 将 入 射 光 旋转 180^ —270^ . 


STN LCD 











较 TN 高 。 
STN 搭配 




















子 计算 器 等 。 











示 红 、 绿 、 蓝 三 原色 ， 再 经 由 三 原色 按 比 例 调 








彩色 波光 片 ， 将 单 色 显 示 矩 








， 反 映 速度 很 慢 ， 故 主要 





与 TN 类 似 ， 区 别 在 于 TN 7$ 
T TN 视角 狭小 的 缺点 ， 





STN 改善 





























WRH 








反应 速度 也 较 慢 ， 


色彩 对 比 度 仍 较 小 ， 


















































于 简单 的 数字 符 与 文字 的 














型 的 液晶 分 子 将 入 射 光 旋转 90°, Mi STN 




















F 的 任 一 像素 分 成 3 个 子 像素 ， 
上 吉 近 全 彩 模式 的 
般 的 操作 显示 接口 。 

















分 别 透 过 彩色 滤 光 片 显 
色彩 。STN 显示 的 画面 
































随后 出 现 的 DSTN 通过 双 扫 描 方式 来 显示 ， 显 示 效 果 相 对 STN 而 言 有 了 较 大 幅度 的 提高 











DSTN 的 反应 速度 可 


i$ 























因此 ， 当 在 屏幕 画面 


























TN 5 STN 型 液晶 
化 的 反应 时 间 就 会 拉 长 ， 显 示 器 的 速度 虽 
动 式 TFT 型 的 液晶 显示 
配 向 膜 、 液晶 材料 和 注 
fr TFT 型 LCD ! 

















REZ, RPA 
Sis si AE E BEA 





























而 成 4x? 或 «m 














| 100ms， 但 是 在 电场 反复 改变 电压 的 过 程 中 ， 
Jp E” 现象 。 








一 像素 的 恢复 过 程 较 慢 。 














E 动 方式 ， 如 果 显示 
不 上 。 为 了 解决 这 























个 问题 ， 




















器 的 结构 较为 复杂 ， 它 包括 背光 管 、 导 光板 、 偏 
膜 式 晶体 管 等 。 








尺寸 加 大 ， 中 心 部 位 对 电极 变 
主动 式 和 矩阵 驱动 被 提出 ， 主 
6 板 、 滤 光板 、 玻 璃 基板 、 
































， 晶 体 管 矩阵 依 显 示 信 和 号 姑 
对比， 避免 了 显示 器 对 








TN/STN 更 佳 , i 
记 本 电脑 、 数 码 
一 块 LCD 
























































而 显示 对 比 度 可 达 150:1 EJ I 
|. MP4 等 
图 像 不 但 需要 LCD 驱动 























F 启 或 关闭 液晶 分 























电场 效应 的 依靠 。 
上 ， 反 应 速度 逼近 30ms 甚至 























子 的 电压 ， 使 液晶 分 子 轴 转 向 
Eb, TFT LCD 的 显示 质量 较 












































更 快 ， 适 用 于 PDA、 笔 











器 ， 还 需要 有 相应 的 LCD 控制 器 。 通 和 常 LCD 
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驱动 器 会 以 COF/COG 的 形式 与 LCD 玻璃 基板 制 








作 














实现 。 许 多 MCU 内 部 直接 集成 了 LCD Pi 














器， 通过 LCD $i 

















TFT BÉ. 
TFT 屏 是 目前 嵌入 式 系统 应 用 的 主流 ， 














图 18.1 所 

















在 一 起 ， 而 LCD 控制 器 则 由 外 部 
出 器 可 以 方便 地 控制 STN 和 














BER OK 
































示 给 出 了 TFT 屏 的 典 

















VCLK、HSYNC 和 VSYNC 分 别 为 像素 时 钟 信 号 C 
和 帧 同步 信号 ，VDEN 为 数据 有 效 标志 信号 ，VD 为 图 
































像 的 数据 信号 。 








| 
| VBPD-*1 
IVSPWH 























4 
HSPW-*1 HBPD 


— 


HOZVAL+1 


18.1. TFT 屏 工作 时 序 


作为 





型 时 序 。 时 序 图 中 的 
j 于 锁 存 图 像 数据 的 像素 时 钟 )、 行 同步 信号 





贞 同 步 信 号 的 VSYNC， 每 发 出 一 个 脉冲 ， 都 意味 着 新 的 一 屏 图 像 数据 3 











为 行 同步 信号 的 HSYNC， 每 发 出 一 个 脉冲 都 表明 新 的 
同步 的 头 尾 都 必须 留 有 回 扫 时 间 。 这 样 的 时 序 安排 起 源 于 CRT 显示 器 
































于 始 发 送 。 而 作 


行 图 像 资料 开始 发 送 。 在 帧 同步 以 及 行 












































图 18.2 给 出 了 LCD 控制 器 中 应 该 设置 的 TFT 
的 回 扫 时 间 ， 左 边界 和 右边 界 即 为 行 切 换 的 回 扫 时 间 ， 























但 后 来 成 为 实际 上 的 工业 标准 ， 因 此 TFT 屏 也 包含 了 回 扫 时 间 。 
usd, Ri 











T 











的 上 




















E 子 枪 偏转 所 需要 的 时 间 ， 


边界 和 下 边界 即 为 帧 切换 











水 平 同步 和 垂直 






























































身 需 要 的 时 间 。xres 和 yres 则 分 别 是 屏幕 的 水 平和 生 























率 主 要 为 320X240、640X480 等 。 





同步 分 别 是 行 和 帧 同步 本 


备 的 LCD 分 辨 
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18.2 LCD 控制 器 中 的 时 序 参 数 设 置 


IA vix: 


18.2.1 qi RP BUS 

帧 缓冲 (framebuffer) 是 Linux 系统 为 显示 设备 提供 的 一 个 接口 ， 它 将 显示 缓冲 区 抽象 ， 屏 
蔽 图 像 硬件 的 底层 差异 ， 人 允许 上 层 应 用 程序 在 图 形 模式 下 直接 对 显示 缓冲 区 进行 读 写 操作 。 用 户 
不 必 关 心 物 理 显 示 缓 冲 区 的 具体 位 置 及 存放 方式 ， 这 些 都 由 帧 缓冲 设备 驱动 本 身 来 完成 。 对 于 帧 
缓冲 设备 而 言 ， 只 要 在 显示 缓冲 区 中 与 显示 点 对 应 的 区 域 写 入 颜色 值 ， 对 应 的 颜色 会 自动 在 屏幕 
上 显示 ，18.2.2 小 节 将 讲解 显示 缓冲 区 与 显示 点 的 对 应 关系 。 

帧 缓冲 设备 为 标准 字符 设备 ， 主 设备 号 为 29， 对 应 于 /dev/fbn 设备 文件 。 帧 缓冲 驱动 的 应 用 
非常 广泛 ， 在 Linux 的 桌面 系统 中 ，X Window 服务 器 就 是 利用 帧 缓冲 进行 窗口 的 绘制 。 花 入 式 系 
统 中 的 QUVEmbedded 等 图 形 用户 界 面 环境 也 基于 帧 缓冲 而 设计 。 


18.2220 ”显示 缓冲 区 与 显示 点 
在 帧 缓冲 设备 中 ， 对 屏幕 显示 点 的 操作 通过 读 写 显示 缓冲 区 来 完成 ， 在 不 同 的 色彩 模式 下 ， 
显示 缓冲 区 和 屏幕 上 的 显示 点 有 不 同 的 对 应 关系 ， 表 18.2 一 表 18.4 分 别 给 出 了 16 级 灰 度 、8 位 色 














































































































































































































































































































































































































和 16 位 情况 下 显示 缓冲 区 与 显示 点 的 对 应 关系 。 
表 18.2 16 级 灰 度 显示 缓冲 区 与 显示 点 的 对 应 关系 
位 31—28 | 27~24 | 23~20 19-16 157412 11—8 7~4 3~0 
0x0 点 7 点 6 点 5 点 4 点 3 点 2 点 1 点 0 
0x04 点 15 点 14 点 13 点 12 点 11 点 10 点 9 点 8 
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位 31—28 27-24 23-20 19—16 15-12 11—8 
0x0 点 0 点 1 点 2 点 3 点 4 点 5 
Ox04 点 8 点 9 点 10 点 11 点 12 点 13 
表 18.3 8 位 色 时 显示 缓冲 区 与 显示 点 的 对 应 关系 
RGB BGR 
7~5 4~2 1~0 7~5 4—2 
R G B 
表 184 16 位 色 时 显示 缓冲 区 与 显示 点 的 对 应 关系 
位 15—411 10-5 
RGB565 R 
RGB555 R 








18.2.3. Linux 帧 缓冲 相关 数据 结构 与 画 数 


1. fb info 结构 体 





























代码 清单 18.1 


























el ee 

2 int node; 

3 int flags; 

4 struct mutex lock; /* 用 于 open/release/ioctl 的 锁 */ 
5 struct fb var screeninfo var; /#* 可 变 参 数 */ 

6 struct fb fix screeninfo fix; /* 固 定 参数 */ 

7 struct fb monspecs monspecs; /* 显 示 器 标准 */ 

8 struct work struct queue; /* 帧 缓冲 事件 队列 */ 

9 struct fb pixmap pixmap; /* 图 像 硬 件 mapper */ 


SErUCE 





fb pixmap sprite; 











SEEFUCE 








前 的 颜色 表 */ 








fb cmap cmap; /* 
list head modelist; 
fb videomode *mode; 


St 





SETUCE 


/* 对 应 的 背光 设备 */ 
struct backlight device *bl dev; 
* 背光 调整 */ 
struct mutex bl mutex; 
u8 bl curve[FB BACKLIGHT LEVELS]; 
#endif 





0 
E 
2 
3 
4 
D #ifdef CONFIG FB BACKLIGHT 
6 
7 
8 
9 
0 
1 





VATIC HEC BER AAE fb info 结构 体 ( 为 了 信 





fb info 结构 体 


/* 光标 硬件 mapper */ 


/* 目前 的 video 模式 */ 











Fici, RIH 
FBI 中 包括 了 关于 帧 缓冲 设备 属性 和 操作 的 完整 描述 ， 这 个 结构 体 的 定义 如 代码 ; 
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简称 为 “FBI”), 
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22 #ifdef CONFIG FB DEFERRED IO 

DE struct delayed work deferred work; 

24 struct fb deferred io *fbdefio; 

25 dendif 

26 struct fb ops *fbops; /* fb_ops， 帧 缓冲 操作 */ 

27 struct device *device; /* 父 设备 */ 

28 struct device *dev; /* fb Wt* */ 

29 int class flag; /* MA sysfs Wu */ 

30 #ifdef CONFIG_FB_TILEBLITTING 

31 struct fb tile ops *tileops; /* AP elice ine */ 
32 dendif 

33 char _ iomem *screen base; /* 虚拟 基地 址 */ 

34 unsigned long screen size; /* ioremapped 的 虚拟 内 存 大 小 */ 
35 void *pseudo palette; /* 伪 16 色 颜 色 表 */ 

36 #define FBINFO STATE RUNNING 0 

51! #define FBINFO STATE SUSPENDED 1L 

38 u32 state; /* 硬件 状态 ， 如 挂 起 */ 

39 void *fbcon par; 

40 void *par; 

Ad pp 











FBI 中 记录 了 帧 缓冲 设备 的 全 部 信息 ， 包 括 设 备 的 设置 参数 、 状 态 以 及 操作 函数 指针 。 每 一 
个 帧 缓冲 设备 都 必须 对 应 一 个 FBI。 

2. fb ops 结构 体 

FBI 的 成 员 变 量 fbops 为 指向 底层 操作 的 函数 的 指针 ， 这 些 函 数 是 需要 驱动 程序 开发 人 员 编 
号 的 ， 其 定义 如 代码 清单 18.2 所 示 。 


代码 清单 18.2. fb ops 结构 体 























































































































Stet ED ODS 

2 struct module *owner; 

3 /* 打开 /释放 */ 

4 Tac (ro oe) (ee ee eo O Aoa Le VESTS 

5 int(*fb release) (struct fb info *info, int user); 

6 

7 /* 对 于 非 线性 布局 的 /常规 内 存 映射 无 法 工作 的 帧 缓冲 设备 需要 */ 

8 5Blse c (vio read)leLtrüct file "file. char — usen "but, Size b CONE, 

9 onr oop 

0 SD tro write) (erret Eile "roble. const char . user Aawit, Sae t cónnt. 
1 dioweit ie. velop 

2 

3 /* 检测 可 变 参数 ， 并 调整 到 支持 的 值 */ 

4 int(*fhb check var) (struct fb war screeninfto *var, sttück fb mto *info). 
S 

6 /* 根据 info-»var WE video 模式 */ 

7 int(*fb set par) (struct fb info *info); 

8 

9 /* WE color 寄存 器 */ 

20 int(*fb setcolreg) (unsigned regno, unsigned red, unsigned green, unsigned 
T blue, unsigned transp, struct fb info *info); 

22 

23 /* 批量 设置 color 寄存 器 ， 设 置 颜色 表 */ 

24 Tac (Srg seteme) (Seren ro omeo ene Serwer o EO VEO 

25 
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26 VE 

2 ine Gio olamk) (ne olamk, Se o into Simio) p 

28 

29 /* pan xs */ 

20 int(*fb pan display) (struct fb var screeninfo *var, struct fb info *info); 
St 

32 /* EWEN */ 

33 vorstcttbp rrilirect)fStruct fb iaro tinrftoy eonst stroct fb-fillrect TEC)? 
34 /* 数据 复制 */ 

IIb void(*fb copyarea) (struct fb info *info, const struct fb copyarea *region); 
36 /* 图 形 填充 */ 

37 void(*fb imageblit) (struct fb info *info, const struct fb image *image); 
38 

39 /* 绘制 光标 */ 

40 3xt*trb cursom (struct rbocfo tinto sttücb fb cHÉSOC 'CUfsOrI) 

4 

4 /* 旋转 显示 */ 





void(*fb rotate) (struct fb info *info, int angle); 


1 
2 
9 
4 
45 /* Ski blit ZW (mm) */ 
6 sane o9; Gase) (Erene ior aboao "abore p 
7 
8 





/* fb 特定 的 ioctl (可 选 ) */ 
stone Cag roet i ee elo dle ee EES ame eme ha mead Jioxarey vesc) p 





~ 
Ko) 


51  /* 处 理 32 位 的 compat ioctl (可 选 ) */ 
52 int(*fb compat ioctl) (struct fb info *info, unsigned cmd, unsigned long arg); 


54  /* fb 特定 的 mmap */ 
55  int(*fb mmap) (struct fb info *info, struct vm area struct *vma); 











57  /* 保存 目前 的 硬件 状态 */ 


58. Tene/ i geva Sem fb info *tnfo); 











60  /* 恢复 被 保存 的 硬件 状态 */ 


Gl yoridi restore otete) erruet FD info vinto)? 


($3) vore robet eads) (Graner ador baro no tt es 
64 struct fb var screeninfo *var); 
CIONES; 


fb ops 的 fb check var0 成 员 函 数 用 于 检查 可 以 修改 的 屏幕 参数 并 调整 到 合适 的 值 ， 而 
fb set par0O 则 使 得 用 户 设置 的 屏幕 参数 在 硬件 上 有 效 。 

3. fb var screeninfo 和 fb fix screeninfo 结构 体 

FBI 的 fb var screeninfo 和 fb fix screeninfo 成 员 也 是 结构 体 ，fb_var_screeninfo 记录 用 户 可 
修改 的 显示 控制 器 参数 ， 包 括 屏幕 分 辨 率 和 每 个 像素 点 的 比特 数 。fb_var_screeninfo 中 的 xres 定 
屏幕 一 行 有 多 少 个 点 ，yres 定义 屏幕 一 列 有 多 少 个 点 ，bits_per_pixel 定义 每 个 点 用 多 少 个 字 节 
AER M fb fix screeninfo 中 记录 用 户 不 能 修改 的 显示 控制 器 的 参数 ， 如 屏幕 缓冲 区 的 物理 地 址 、 
长 度 。 当 对 帧 缓冲 设备 进行 映射 操作 的 时 候 ， 就 是 从 fb_fix_screeninfo 中 取得 缓冲 区 物理 地 址 的 。 
上 述 数 据 成 员 都 需要 在 驱动 程序 中 初始 化 和 设置 。 

fb var screeninfo 4ll fb. fix. screeninfo 结构 体 的 定义 分 别 如 代码 清单 18.3 和 代码 清单 18.4 所 示 。 












































ad 











































































































X 


















































































































































Een 































































































446 INUX 





LCD 设备 驱动 


oo 


代码 清单 18.3 fb var screeninfo 结构 体 


struct fb var screeninfo { 


/* 可 见解 析 度 */ 





u32 xres; 
u32 yres; 


1 
2 
3 
4 
5 /* 虚拟 解析 度 */ 
6 
7 
8 
9 








u32 xres virtual; 

u32 yres virtual; 

/* 虚拟 到 可 见 之 间 的 偏 移 */ 
2 «offe 










































































0 u32 yoffset; 

1 

2 u32 bits per pixel; /* 每 像素 位 数 ，BPP */ 

3 u32 grayscale; / 非 0 时 指 灰 度 */ 

4 

5 — /* fb 缓存 的 RN\GNB 位 域 */ 

6 struct th bicireld red) 

7 struct fb bitfield green; 

8 Struct th bitirerd blue; 

9 struct fb bitfield transp; /* XSHjHE */ 

20 

21  u32 nonstd; /* !- 0 dEb EGRE */ 

22 

255) u32 activate; 

24 

25  u32 height; ak */ 

26  u32 width; /*EHE */ 

21 

28 SS 

29 

30 /* 定时 : 除了 pixclock 本 身 外 ， 其 他 的 都 以 像素 时 钟 为 单位 */ 
SY 06 /7 

32 u32 left margin; /* 行 切 换 : 从 同步 到 绘图 之 间 的 延迟 */ 
33 u32 right margin; /* 行 切 换 : 从 绘图 到 同步 之 间 的 延迟 */ 
34 u32 upper margin; /* 帧 切换 ， 从 同步 到 绘图 之 间 的 延迟 */ 
35 u32 lower margin; /* 帧 切换 ， 从 绘图 到 同步 之 间 的 延迟 */ 
36 u32 hsync len; /* 水 平 同 步 的 长 度 2 

37] u32 vsync len; /* 垂直 同步 的 长 度 B 





























38 2 SVG 

Bo u32 vmode; 

40 u32 rotate; /* 顺 时 钟 旋转 
41 u32 reserved[5]; /* 保留 */ 
42 Y; 








ct 
RE 

* 
Sx 

















代码 清单 18.4 fb fix screeninfo 结构 体 

Struct iD Tix SOreerninfo di 

char id[16]; /* 字符 串 形式 的 标识 符 */ 

unsigned long smem start; /* fb 缓冲 内 存 的 开始 位 置 〈 物 理 地 址 ) */ 

u32 smem len; /* fb 缓冲 的 长 度 */ 

TA oa /Iv PY m 

u32 type aux; /* Interleave */ 

uis yieee /A pa VISUAL à 

ul6 xpanstep; /* 如 果 没 有 硬件 panning ， 赋 0 */ 




















LO N 











~ 





coo -J OY O! 
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式 包括 如 下 几 种 。 





CA Ts te 


} 


ul6 ypanstep; 

ul6 ywrapstep;/ 

u32 line length; /* 1[1T1Hj]5E BA */ 

unsigned long mmio start; /* 内 存 映 射 I/0 的 开始 位 置 */ 
u32 mmio len; /* 内 存 映射 1/0 的 长 度 */ 

u32 accel; 

ul6 reserved[3]; /* ÍRÉI*/ 




















r 












































代码 清单 18.4 中 第 7 行 的 visual 记录 屏幕 使 用 的 色彩 模式 ， 在 Linux 系统 中 ， 支 持 的 色彩 模 





4. fb bitfield 结构 体 


代码 











Monochrome (FB_VISUAL_MONO01、FB_VISUAL_MONO10)， 每 个 像素 是 黑 或 白 。 
Pseudo color FB. VISUAL PSEUDOCOLOR, FB VISUAL STATIC PSEUDOCOLOR), 
即 伪 彩 色 ， 采 用 索引 颜色 显示 。 

True color (FB VISUAL _TRUECOLOR )， 真 彩色 ， 分 成 红 、 绿 、 蓝 三 基色 。 

Direct color (FB. VISUAL DIRECTCOLOR )， 每 个 像素 颜色 也 是 由 红 、 绿 、 蓝 组 成 ， 不 
过 每 个 颜色 值 是 个 索引 ， 需 要 查 表 。 


Grayscale displays， 灰 度 显 示 ， 红 、 绿 、 蓝 的 值 都 
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清单 18.3 58 16. 17. 18 行 分 别 记录 R, G, B 的 位 域 ，fb_bitfield 结构 体 描述 每 一 像素 
区 的 组 织 方 式 ， 包 含 位 域 偏 移 、 位 域 长 度 和 MSB (最 高 有 效 位 〉 指示， 如 代码 清单 18.5 
























































代码 清单 18.5 fb bitfield 结构 体 


SIUE imos Ed ec 


__u32 offset; /* 位 域 偏 移 NA 
.—.u32 length; /* fub EE ie 
— u32 msb-right; /*!-0: MOB HEA */ 





; 


5. fb cmap 结构 体 


fb cmap 结构 体 记录 设备 无 关 的 颜色 表 信 息 ， 
FBIOPUTCMAP 命令 读 取 或 设 定 颜色 表 。 
































户 空间 可 以 通过 ioctl0 的 FBIOGETCMAP 和 
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代码 清单 18.6 fb cmap 结构 体 
















































































OCR 

2 u32 start; /* 88 1 470A x 

3 u32 len; /* 元 素数 量 */ 

4 /* R G B. XEBIEE*/ 

E uló6 *red; 

6 ul6 *green; 

y ul6 *blue; 

8 ul6 *transp; 

PET 

代码 清单 18.7 所 示 为 用 户 空间 获取 颜色 表 的 例 程 ， 若 BPP 为 8 位 ， 则 颜色 表 长 度 为 236; d 
BPP 为 4 位 ， 则 颜色 表 长 度 为 16; 否则 ， 颜 色 表 长 度 为 0， 这 是 因为 ， 对 于 BPP 大 于 等 于 16 的 
情况 ， 使 用 颜色 表 是 不 划算 的 。 
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代码 清单 18.7 ”用 户 空间 获取 颜色 表 例 程 




















1 /* 读 入 颜色 表 */ 

2 if ((vinfo.bits per pixel == 8) || (vinfo.bits per pixel == 4)) { 

B Screencols - (vinfo.bits per pixel -- 8) ? 256 : 16;/* BGXX/ */ 

4 ine eee 

5) Startcmap - new fb cmap; 

6 startcmap-»start = 0; 

Ji Startcmap-»len = screencols; 

8 /* 分 配 颜色 表 的 内 存 */ 

9 startcmap->red = (unsigned short int*)malloc (sizeof (unsigned short int) 
0 *screencols); 
1 startcmap->green = (unsigned short int*)malloc(sizeof(unsigned short int) 
2 *screencols); 

3 startcmap->blue = (unsigned short int*)malloc (sizeof (unsigned short int) 
4 *screencols); 

5 startcmap-»transp = (unsigned short int*)malloc(sizeof(unsigned short int) 
6 *screencols); 

7 /* 获取 颜色 表 */ 

8 ioctl(fd, FBIOGETCMAP, startcmap); 

9 ico orc Mor oos c WE oni Nee c MET 

20 Screenclut[loopc] = qRgb(startcmap-»red[loopc] >> 8, startcmap 

2L -»green[loopc] >> 8, startcmap-»blue[loopc] >> 8); 

22 } 

2391 






































对 于 一 个 256 色 CBPP-8) 的 800X600 分 辩 率 的 图 像 而 言 ， 若 红 、 绿 、 蓝 分 别 用 一 个 字 节 描述 ， 
则 需要 800X 600X3=1440 000Byte 的 空间 ， 而 若 使 用 颜色 表 ， 则 只 需要 800 X 600 X 1+256X3= 
480768Byte 的 空间 。 

6. 文件 操作 结构 体 

作为 一 种 字符 设备 ， 帧 缓冲 设备 的 文件 操作 结构 体 定 义 于 /linux/drivers/vedio/fomem.c 文件 中 ， 
如 代码 清单 18.8 所 示 。 
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代码 清单 18.8 ” 帧 缓冲 设备 文件 操作 结构 体 


Static struct file operations fb fops - ( 








2 .owner = THIS MODULE, 

3 .read = fb read, 

4 .write = fb write, 

3 roet -—- xternuexei li; 

6 #ifdef CONFIG COMPAT 

jq Soom noe el MINOS e ei 

8 #endif 

9 .mmap = fb mmap, 

0 .open - fb open, 

3L .release - fb release, 

2 #ifdef HAVE ARCH FB UNMAPPED AREA 

B .get unmapped area - get fb unmapped area, 
a #endif 

5) #ifdef CONFIG FB DEFERRED IO 

6 .fsync - fb deferred io fsync, 
7 #endif 

CES 
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帧 缓冲 设备 驱动 的 文件 操作 接口 函数 已 经 在 fomem.c 中 被 统一 实现 ， 一 般 不 需要 由 驱动 工程 
师 再 编写 。 

7. 注册 与 注销 帧 缓冲 设备 

Linux 内 核 提 供 了 register_framebuffer() 和 unregister_framebufferO 函 数 分 别 注 册 和 注销 帧 缓冲 
设备 ， 这 两 个 函数 都 接受 FBI 指针 为 参数 ， 原 型 为 : 


int register framebuffer(struct fb info *fb info); 
int unregister framebuffer(struct fb info *fb info); 


对 于 register_framebuffer() 函 数 而 言 ， 如 果 注 册 的 帧 缓冲 设备 数 超过 了 FB MAX (目前 定义 为 
32)， 则 函数 返回 -ENXIO， 注 册 成 功 则 返回 0。 










































































IE WE] Linux 性 绥 冲 设备 驱动 结构 


图 18.3 所 示 为 Linux 帧 缓冲 设备 驱动 的 主要 结构 ， 帧 缓冲 设备 提供 给 用 户 空间 的 file operations 结 
构 体 由 fbmem.c 中 的 file operations 提供 ， 而 特定 帧 缓冲 设备 fb info 结构 体 的 注册 、 注 销 以 及 其 
成 员 的 维护 ， 尤 其 是 fb ops 中 成 员 函 数 的 实现 则 由 对 应 的 xxxfb.c 文件 实现 ，fb_ops 中 的 成 员 
数 最 终 会 操作 LCD 控制 器 硬件 寄存 器 。 






























































































































































ES 








用 户 空间 


fbmem.c 


xxxfb.c 


fb ops 


18.3 ” 帧 缓冲 设备 驱动 的 程序 结构 


19.4 六 缓 六 设备 驱动 的 模块 加 载 与 卸载 画 数 


在 帧 缓冲 设备 驱动 的 模块 加 载 函 数 中 ， 应 该 完成 如 下 4 个 工作 。 
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(D 申请 FBI 结构 体 的 内 存 空 间 ， 初 始 化 FBI 结构 体 中 国定 和 可 变 的 屏幕 参数 ， 即 填充 FBI 
fb var screeninfo var 和 struct fb fix screeninfo fix 成 员 。 

(2) 根据 具体 LCD 屏幕 的 特点 ， 完 成 LCD 控制 器 硬件 的 初始 化 。 

(3) 申请 帧 缓冲 设备 的 显示 缓冲 区 空间 。 

(4) 注册 帧 缓冲 设备 。 

在 帧 缓冲 设备 驱动 的 模块 卸载 函数 中 ， 应 该 完成 相反 的 工作 ， 包 括 释 放 FBI 结构 体内 存 、 关 
闭 LCD、 释 放 显 示 绥 冲 区 以 及 注销 帧 缓冲 设备 。 
由 于 LCD 控制 器 经 常 被 集成 在 SoC 上 作为 一 个 独立 的 硬件 模块 而 存在 (成 为 platform device), 
因此 ，LCD 了 驱动 中 也 经 常 包含 平台 驱动 ， 这 样 ， 在 帧 缓冲 设备 驱动 的 模块 加 载 函 数 中 完成 的 工作 只 
月 平台 驱动 ， 而 初始 化 FBI 结构 体 中 的 固定 和 可 变 参数 、LCD 控制 器 硬件 的 初始 化 、 申 请 帧 组 
冲 设 备 的 显示 缓冲 区 空间 和 注册 帧 缓冲 设备 的 工作 则 移交 到 平台 驱动 的 探测 函数 中 完成 。 
同样 地 ， 在 使 用 平台 驱动 的 情况 下 ， 释 放 FBI 结构 体内 存 、 关 闭 LCD、 释 放 显 示 绥 冲 区 以 及 
注销 帧 缓冲 设备 的 工作 也 移交 到 平台 驱动 的 移 除 函数 中 完成 。 
尺码 清单 18.9 所 示 为 帧 缓冲 设备 驱动 的 模块 加 载 和 镍 载 以 及 平台 驱动 的 探测 和 移 除 函 数 中 的 模板 。 
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代码 清单 18.9 帧 缓冲 设备 驱动 的 模块 加 载 /卸载 及 平台 驱动 的 探测 / 移 除 函数 的 模板 











1 /* 平台 驱动 结构 体 */ 

2. eNet oe no ben ne lo ee A 
3 .probe = xxxfb probe, 

4 .remove - xxxfb remove, 

9 .Suspend = xxxfb suspend, 

6 .resume - xxxfb resume, 

yi .driver = { 

8 .name - "xxx-lcd", /* EA */ 

9 .owner = THIS MODULE, 

0 } 

1]; 

2 

3 /* 平台 驱动 探测 函数 */ 

ak eee nie nx Ol 

Bo 

6 Struct m9 Info *intor 

j 

8 /* 分 配 £b info 结构 体 */ 

9 info = framebuffer alloc(...); 

20 

2 info-»screen base = framebuffer virtual memory; 
22 info-»var = xxxfb var; /* 可 变 参 数 */ 
23 info-»fix = xxxfb fix; /* 固定 参数 */ 
24 
25 / Ay B Ez DE DX / 
26 arre oS Joybtie ietese te p 
2 
28 /* 初 始 化 LCD 控制 器 */ 
29 edian (so og 
30 
31 /* 检 查 可 变 参数 */ 
32 xxxfb check var(&info-»var, info); 
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33) 

34 / *ti€l £b info*/ 

3/5) if (register framebuffer(info) < 0) 

36 return - EINVAL; 

a 

38 return 0; 

SON 

40 

41 /* 平台 驱动 移 除 函数 */ 

42 static void _ Exit 56:319 remove...) 

43 { 

44 struct fb_info *info = dev_get_drv_data (dev); 
45 

46 abs (aene) d 

47 unregister framebuffer(info); /* 注销 fb info */ 
48 dealloc dis buffer(...); /* 释放 显示 缓冲 区 */ 
49 framebuffer release(info); /* 注销 fb info */ 
50 } 

ST 

52 return 0; 

S3 

54 


55 /* Wi EL RSR RIRS RR */ 


5S ame agar. AXIO TOLEO 


58 return platform driver register(&xxxfb driver); /* 注册 平台 设备 */ 





61 static void exit xxxfb cleanup (void) 





63 platform driver unregister(&xxxfb driver); /* 注销 平台 设备 */ 





65 
66 module init(xxxfb init); 
67 module exit (xxxfb cleanup); 


上 述 代 码 中 第 35 fT. 47 行 成 对 出 现 的 register framebuffer()ll unregister framebuffer()7 jl] H 
于 注册 和 注销 帧 缓冲 设备 。 





















































18.5 D EXIT CELLS LLL 


在 藤 入 式 系统 中 ， 一 种 常见 的 方式 是 直接 在 RAM 空间 中 分 配 一 段 显 示 缓 冲 区 ， 典 型 结构 如 
图 18.4 所 示 。 


























































SDRAM 
控制 器 


LCD 
控制 器 


18.4 在 RAM 中 分 配 显示 缓冲 区 





SDRAM 
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MCU 
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在 分 配 显示 缓冲 区 时 一 定 要 考虑 cache 的 一 致 性 问题 ,因为 系统 往往 会 通过 DMA 方式 搬移 
显示 数据 。 合 适 的 方式 是 使 用 dma alloc writecombine()ER 2 47 Bt — Bt writecombining 区 域 ,对 应 
的 writecombining 区 域 由 dma free writecombine()Es AF% BR. ,如 代码 清单 18.10 所 示 。 

writecombining 意味 着 “ 写 合 并 ”， 它 允许 号 入 的 数据 被 合并 ， 并 临时 保存 在 写 合并 缓冲 区 
(WCB) F, 直到 进行 一 次 burst 传输 而 不 再 需要 多 次 single 传输 。 通 过 dma alloc | writecombine() 
分 配 的 显示 缓冲 区 不 会 出 现 cache 一 致 性 问题 ， 这 一 点 类 似 于 dma _alloc_coherent()。 

















eo 








































































































代码 清单 18.10 — tui i o RC DERI 43 Bo E ER 








1 static int  Jinit xxxfb map video memory(struct xxxfb info *fbi) 

2 q 

3 fbi-»map size = PAGE ALIGN(fbi-»fb-»fix.smem len + PAGE SIZE); 
4 fbi-»map cpu = dma alloc writecombine(fbi-»dev, fbi-»map size, 
E &fbi-»map dma,GFP KERNEL); /* 分 配 内 存 */ 

6 

7 fbi-»map size = fbi-»fb-»fix.smem len; /* 显示 缓冲 区 大 小 */ 

8 

a Tf ffbresmap-cepu) 4 

0 memset(fbi-»map cpu, Oxf0, fbi-»map size); 

I 

2 fbi->screen_dma = fbi-»map dma; 

3 fbi->fb->screen base = fbi-»map cpu; 

4 fbi->fb->fix.smem_start = fbi->screen_dma; 

5 } 

6 

7 return fbi-»map cpu ? 0 : - ENOMEM; 

8 

9 

20 static inline void xxxfb unmap video memory(struct s3c2410fb info *fbi) 
2s 

22 /* 释放 显示 缓冲 区 */ 

23 dma free writecombine(fbi-»dev,fbi-»map size,fbi-»map cpu, fbi-»map dma); 
24 








18.60 nao sum 


18.6.1 定时 参数 

FBI 结构 体 可 变 参数 var 中 的 left margin. right margin. upper margin, lower margin, hsync len 
和 vsync. len 直接 查 LCD 的 数据 手册 就 可 以 得 到 ， 图 18.5 所 示 为 某 LCD 数据 手册 中 直接 抓 图 获 
得 的 定时 信息 。 
由 图 18.5 可 知 对 该 LCD 而 言 ，var 中 各 参数 的 较 合 适 值 分 别 为 : left_ margin = 104, right margin = 8, 


upper margin = 16, lower margin =2, hsync len=8, vsync len-2. 
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显示 参数 yg 条 件 " 
mie Ts maemae 单位 


























Vertical cvcle VP 648 660 670 f 
Vertical data start VDS VS+VBP 4 4 4 行 
Vertical Sync Pulse width 2 2 EE 
Vertical front porch VFP 4 16 26 | f 
Vertical Back porch VBP 2 2 2 fT 
Vertical blanking period VBL VS+VBP+VFP 8 20 30 | 行 
m Vertical active area VDISP 640 640 640 fT 
WR Horizontal cycle HP 559 | 600 | 620 | 点 
Horizontal front porch 63 | 104 | DA | 点 
Horizontal Sync Pulse width HS 8 8 8 点 
Horizontal Back porch HBP 8 8 8 点 
Horizontal Data start HDS HS+HBP 16 16 16 点 
Horizontal active area 480 | 480 | 480 | 点 
" fclk 22 26 28 MHz 
Clock frequency telk 45 38 35 Es 














18.5 LCD 数据 手册 中 定时 参数 示例 


18.6.2 ”像素 时 钟 


FBI 可 变 参 数 var 中 的 pixclock 意味 着 像素 时 钟 ， 例 如 ， 如 果 为 28.37516 MHz， 那 么 画 1 个 


像素 需要 35242 ps CERO: 
1/(28.37516E6 Hz) - 35.242E-9 s 
如 果 屏 幕 的 分 辨 率 是 640X480， 显 示 一 行 需要 的 时 间 是 ; 
640*35.2428-9 & — 22.555E-b5 G 
每 条 扫描 线 是 640， 但 是 水 平 回 扫 和 水 平 同步 也 需要 时 间 ， 假 设 水 了 
像素 时 钟 ， 因 此 ， 画 一 条 扫描 线 完整 的 时 间 是 : 
(640-272)*35.242E-9 s - 32.141E-6 s 
可 以 计算 出 水 平 扫描 率 大 约 是 31kHz: 
JL (Saba. e - Sis Jstz 
完整 的 屏幕 有 480 线 ， 但 是 垂直 回 扫 和 垂直 同步 也 需要 时 间 ， 假 设 垂直 回 扫 和 重 
49 个 像素 时 钟 ， 因 此 ， 画 一 个 完整 的 屏幕 的 时 间 是 : 
(480-49) *32.141E-6 s - 17.002E-3 s 
可 以 计算 出 垂直 扫描 率 大 约 是 59kHz: 
/OO ES 0 
这 意味 着 屏幕 数据 每 秒 钟 大 约 刷 新 59 次 。 


18.6.3 ”颜色 位 域 


FBI 可 变 参 数 var 中 的 red, green 和 blue 位 域 的 设置 直接 由 显示 缓冲 区 与 显示 点 的 对 应 关系 
决定 ， 例 如 ， 对 于 RGB565 模式 ， 查 表 18.4，red 占据 5 位 ， 偏 移 为 11 |; green 占据 6 位 ， 偏 
移 为 5 位 ; blue 占据 5 位 ， 偏 移 为 0 位 ， 即 : 

fbinfo->var.red.offset = 11; 


fbinfo->var.green.offset = 5; 
fbinfo->var.blue.offset = 0; 
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fbinfo-»var.transp.offset o 
fbinfo->var.red.length = 5; 
fbinfo->var.green.length = 6; 
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fbinfo-»var.blue.length = 5; 


18.6.4 ”固定 参数 

FBI 固定 参数 fix 中 的 smem start 指示 帧 缓冲 设备 显示 缓冲 区 的 首 地 址 ，smem_len 为 帧 缓冲 
设备 显示 缓冲 区 的 大 小 ， 计 算 公 式 为 : 

smem len = max xres * max yres * max bpp 


BU. 帧 缓冲 设备 显示 缓冲 区 的 大 小 = 最 大 的 x 解析 度 * 最 大 的 解析 度 * 最 大 的 BPP。 


[[ Nd oet o ops nu m 


FBI 中 的 fp ops 是 使 得 帧 缓冲 设备 工作 所 需 函数 的 集合 ,它们 最 终 与 LCD 控制 器 硬件 打交道 。 

fb_check_var0) 用 于 调整 可 变 参 数 ， 并 修正 为 硬件 所 支持 的 值 ，fb_set_par0 则 根据 屏幕 参数 设 
置 具体 读 写 LCD 控制 器 的 寄存 器 以 使 得 LCD 控制 器 进入 相应 的 工作 状态 。 

对 于 fo ops 中 的 fb fillrect(). fb copyarea()fll fb_imageblit0 成 员 函 数 ， 通 常 直 接 使 用 对 应 的 


























通用 的 cfb fillrect() ~ cfb_copyarea() 和 cfb imageblit() 函 数 即 可 。cfb fillrect() 函数 定义 在 
drivers/video/cfbfillrect.c X4F F, cfb copyarea() 定义 在 drivers/video/cfbcopyarea.c 文件 中 ， 































































































































































































cfb imageblit()*E X. E drivers/video/cfbimgblt.c 文件 中 。 


fb ops 中 的 fb_setcolreg0 成 员 函 数 实现 伪 颜 
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ni 











CR (针对 FB VISUAL TRUECOLOR, FB 














VISUAL DIRECTCOLOR 模式 ) 和 颜色 表 的 填充 ， 其 模板 如 代码 清单 18.11 所 示 。 


OD ol GUY CB cds s DOS LNAS ere Ex 





NO NO NS PN PN 
[T tu S S ME co n) 























代码 清单 18.11 fb_setcolreg() 函 数 模板 


Static int xxxfb setcolreg(unsigned regno, unsigned red, unsigned green, 


{ 


unsigned blue, unsigned transp, struct fb info *info) 


struct xxxfb info *fbi - info-»par; 
unsigned int val; 


switch (fbi-»fb-»fix.visual) f 
case FB VISUAL TRUECOLOR: 
/* 真 彩色 ， 设 置 伪 颜色 表 */ 
if (regno < 16) ( 
u32 *pal = fbi-»5fb-»pseudo palette; 











val = chan to field(red, &fbi-»fb-»var.red); 


val |= chan to field(green, &fbi-»fb-»var.green); 
val |= chan to field(blue, &fbi-»fb-»var.blue); 
pal[regno] = val; 

} 

break; 


case FB_VISUAL_PSEUDOCOLOR: 
re egaa < 256) i 
/* RGB565 模式 */ 
val = ((red >> 0) &0xf800); 
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25 val |= ((green >> 5) &0x07e0); 
26 val |» ((blue >> 11) &0x001f); 
21 

28 writel(val, XXX TFTPAL(regno)); 
29 Schedule palette update(fbi, regno, val); 
30 } 

a break; 

32 

33 } 

34 

35 return 0; 

SIC 














Ms 





上 述 代 码 第 10 行 对 regno < 16 的 判断 意味 着 伪 颜 色 表 只 有 16 个 成 员 ， 实 际 上 ， 它 们 对 应 16 
种 控制 台 颜 色 ，logo Srt fi FLOOR A 



































A 








o 





Í 9.0 LCD RAIDE, mmap 和 ioctl EX 


虽然 帧 缓冲 设备 的 file operations 中 的 成 员 函 数 ， 即 文件 操作 函数 已 经 由 内 核 在 fomem.c X 
件 中 实现 ， 一 般 不 再 需要 驱动 工程 师 修改 ， 但 分 析 这 些 函数 对 于 巩固 字符 设备 驱动 的 知识 以 及 加 
深 对 帧 缓冲 设备 驱动 的 理解 是 大 有 神 益 的 。 

代码 清单 18.12 所 示 为 LCD 设备 驱动 的 文件 操作 读 写 函数 的 源 代 码 , 从 代码 结构 及 习惯 而 言 ， 
与 本 书 第 2 篇 所 讲解 的 字符 设备 驱动 完全 一 致 。 


代码 清单 18.12 ” 帧 缓冲 设备 驱动 的 读 写 函 数 











































































































static ssize t 








2 onedol(e tr uct seme Ee EUST ut ount rome os 
3 ( 

4 unsigned long p - *ppos; 

5 struct inode *inode = file->f path.dentry-»d inode; 
6 int fbidx = iminor(inode); 

7 struct fb info *info - registered fb[fbidx]; 

8 Wis). Mere EGEE 

9 u32 Tomen *src; 

0 Ni oD 48s abe, Weise S307 ere = Tore 

1 unsigned long total size; 

2 

3 

4 

5 buffer ——kmalloe( (count >= PAGE SLAE) ? PAGE-SIZE < count; 
6 GFP KERNEL); 

di if (!buffer) 

8 return -ENOMEM; 

9 
20 src = (u32  iomem *) (info-»5screen base + p); 
21 
22 ee) 
29 info-»fbops-»fb sync (info); 
24 
25 while (count) ( 
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26 和 
Zu dst = buffer; 

28 irons. (abor x» e aoc 

29 *dst- = fb readl(src-t*); 

30 ta ETE a 

sil "WS Soene = (S ds 

do u8-. omem sert = (US Mone *) sro. 
29 

34 fous (a — d o& S x-—E) 

25 *dst8++ = fb readb(src8++); 
36 

5I sre = (W32 — Yomem < Bro; 

38 } 

39 

40 usc G'O ya om S e ous c NET 
41 err = -EFAULT; 

42 break; 

43 ) 

44 *ppos += c; 

45 buf t7 C; 

46 cnt t= c; 

47 countu == 9g 

48  ) 

49 

50 kfree (buffer); 

3 

52 Yerur cur) RII IE CD t 

53  j 

54 


Sit less 

5X9. mo me (eo ee A Oe ee elev onm, ee Yoo he kenns © SINS) 
ior 

58 unsigned long p = *ppos; 

59 struct inode *inode = file->f path.dentry-»d inode; 
60 int fbidx - iminor (inode); 

61 struct fb info *info - registered fb[fbidx]; 

62 WIA 0*buffsr "src 

GS u327  20mem Cer; 

GA WEG OL ent = O Err 9 0: 

65 unsigned long total size; 


66 

67 

68 

69 buffer - kmalloc((count » PAGE SIZE) ? PAGE SIZE : count, 
70 GFP KERNEL); 

Jab if (!buffer) 

12) return -ENOMEM; 

TS) 

74 dst = (u32  iomem *) (info-»5screen base + p); 
3,8) 

76 EGTE On DOPPS DASMA) 

Uy info-»5fbops-»fb sync (info); 

78 

79 while (count) ( 

80 C — (count » PAGE SIZE) ? PAGE SIZE : count; 
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81 src = buffer; 

82 

83 nec (GIVE Erom Usen STO DUT CN A 
84 err = -EFAULT; 

85 break; 

86 } 

87 

88 TOI e EE AME) 

89 fb writel(*src-**, dst); 

90 

Sal (| 

92 wis) Se (re 

93 ue "Tomanm Vesth = Yume -Lomem *» GSEs 
94 

BE Fon = cies ry 

96 fb writeb(*src84-*, dst8-44); 
97 

98 deste (m32 o tomam ty desk 

99 } 

00 

01 *ppos t= c; 

02 buf += c; 

03 Cnt $e; 

04 CODE O7 

DES, 

06 

07 kfree(buffer); 

08 

Yo perbubag eE - cat err; 

10 j 





file operations ! 




















的 mmapO 函 数 非 常 关键 ， 它 将 





空间 可 以 直接 操作 显示 缓冲 区 而 省 去 


















































次 























代码 如 代码 清单 18.13 所 示 。 


SO. 00 d OY OY dme 09 NY PA 





OR oboe Choo B SP SUC 








Se cies ci 


fb mmap(struct file *file, 
. acquires 
. releases 


{ 


int fbidx = 
ETENEE o NEO "into e 
etne je oos elo = 


unsigned 
unsigned 
u32 len; 


TE 


(vma-»vm pgoff » 


代码 清单 18.13 ” 帧 缓冲 设备 驱动 的 mmap 函数 


ET su ares nee < wma) 
(&info-»lock) 
(&info-»1lock) 


iminor(file-»5f path.dentry-»d inode); 
registered fb[fbidx]; 
info-»fbops; 

Ome ffs 

long start; 


C OUL PAGE SHTET) 


return -EINVAL; 


off - 
Serre) 


vma-»vm pgoff «« PAGE SHIFT; 


return -ENODEV; 


wE 


(fb->fb mmap) { 





显示 缓冲 区 映射 到 用 户 空间 ， 从 而 使 得 用 户 
] 户 空间 到 内 核 空间 的 内 存 复制 过 程 
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eoe 


T int res; 

20 mutex lock(&info-»lock); 

21 res = fb-»fb mmap(info, vma); 
22 mutex unlock(&info-»lock); 

29 return res; 

24 ) 

25 

26. mutex tock tsinfo=>Llock); 

2 


28  /* 帧 缓冲 区 内 存 */ 

29 start = info-»fix.smem start; 

30 len = PAGE ALIGN((start & ~PAGE MASK) + info-»fix.smem len); 
SL if (off >= len) ( 





32 /* 内 存 映射 的 IO */ 

2 off -- len; 

34 if (info-»var.accel flags) ( 

515) mutex unlock(&info-»lock); 

36 return -EINVAL; 

3) } 

38 start = info-»fix.mmio start; 

39 len = PAGE ALIGN((start & 一 PAGE MASK) + info-»fix.mmio len); 
40 } 


1 mutex unlock(&info-»lock); 
2 start &= PAGE_MASK; 
3 if ((vma-»vm end - vma-»vm start -* off) » len) 
4 return -EINVAL; 
ASi OPR t= start, 
6  vma-»vm pgoff — off »» PAGE SHIFT; 
7 /* 这 是 一 个 I/0 映射 - 告诉 maydump 跳 过 此 vMA */ 
8 vma-»vm flags |= VM IO | VM RESERVED; 





49 fb pgprotect(file, vma, off); 

50 if (io remap pfn range(vma, vma-»vm start, off »» PAGE SHIFT, 
Sd vma->vm_end - vma->vm_start, vma->vm_page_prot)) 
52 return -EAGAIN; 

na macman Op 

54 j] 

















fb_ioctlO 函 数 最 终 实现 对 用 户 1/O 控制 命令 的 执行 ， 这 些 命令 包括 FBIOGET VSCREENINFO (R 
得 可 变 的 屏幕 参数 )、FBIOPUT_VSCREENINFO (设置 可 变 的 屏幕 参数 )、FBIOGET FSCREENINFO 
《获得 固定 的 屏幕 参数 设置 ， 注 意 ， 固 定 的 屏幕 参数 不 能 由 用 户 设 置 )、FBIOPUTCMAP (X 
置 颜色 表 )、FBIOGETCMAP (获得 颜色 表 ) 等 。 代 码 清单 18.14 所 示 为 帧 缓冲 设备 ioctl( ERI 
数 的 源 代 码 。 
























































































































































代码 清单 18.14 ” 帧 缓冲 设备 驱动 的 ioctl 函数 
long do fb ioctl(struct fb info *info, unsigned int cmd, 
unsigned long arg) 


1L 

2 

3 

4 Se Co GIs rg 

5 struct fb var screeninfo var; 
6 struGE -FH EIX SCroenIdra TLRS 
3 struct fb con2fbmap con2fb; 

8 struct fb cmap user cmap; 

9 struct fb event event; 
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0 void user *argp - (void | user *)arg; 
1 long ret - 0; 
2 
2" CD s infO-*tbops 
a o oi 
5 return -ENODEV; 
6 
Ji switch (cmd) ( 
8 case FBIOGET VSCREENINFO: 
E ret = copy to user(argp, &info-»var, 
20 sizeof(var)) ? -EFAULT : 0; 
Zi break; 
22 case FBIOPUT VSCREENINFO: 
23 if (copy from user(&var, argp, sizeof(var))) ( 
24 ret = -EFAULT; 
25 break; 
26 } 
2m acquire console sem(); 
28 info-»flags |» FBINFO MISC USEREVENT; 
29 ret = fb set var(info, &var); 
30 info-»flags &-2 —FBINFO MISC USEREVENT; 
E release console sem(); 
92 if (ret == 0 && copy to user(argp, &var, sizeof(var)) 
S3 ret = -EFAULT; 
34 break; 
35 case FBIOGET FSCREENINFO: 
36 ret - copy to user(argp, &info-»fix, 
27 SLZOOGL(ELAS I "EP cummpxgubd e (Ug 
38 break; 
39 case FBIOPUTCMAP: 
40 if (copy from user(&cmap, argp, sizeof(cmap))) 
41 ret = -EFAULT; 
42 else 
43 ret = fb set user cmap(&cmap, info); 
44 break; 
45 case FBIOGETCMAP: 
46 if (copy from user(&cmap, argp, sizeof(cmap))) 
47 ret = -EFAULT; 
48 else 
49 ret = fb cmap to user(&info-»cmap, &cmap); 
50 break; 
D» get 
52 SEG ater: 
53 if (fb-»fb ioctl -- NULL) 
54 ret = -ENOTTY; 
599 else 
56 RSN oo oe M (user, eol, use 
57 ) 
58 return ret; 
DOM 
60 
61 static long fb ioctl(struct file *file, unsigned int cmd, unsigned long arg) 
62 | acquires(&info-»lock) 
63  releases(&info-»lock) 
ET 
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65 
66 
67 
68 
69 
70 
al 
72 
出 加 
74 


75 3 
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struct inode *inode = file->f path.dentry-»d inode; 
int fbidx = iminor(inode); 

grruet Pg nl i 

long ret; 


info = registered fb[fbidx]; 
mutex lock(&info-»lock); 

aee — Com Cam or engl, asp) 
mutex unlock(&info-»lock); 

return ret; 


RRO haoa wA h 











































































































































































































































































































































































































































































































































































































































































































通过 /devwfbn， 应 用 程序 可 进行 的 针对 帧 缓冲 设备 的 操作 主要 有 如 下 几 种 。 
€ 读 / 写 dev/fon: 相当 于 读 / 写 屏幕 绥 冲 区 。 例 如 用 cp /dev/fbO tmp 命令 可 将 当前 屏幕 的 内 
容 复制 到 一 个 文件 中 ， 而 命令 cp tmp > /dev/fb0 则 将 图 形 文件 tmp 显示 在 屏幕 上 。 
e 映射 操作 : 对 于 帧 缓冲 设备 , 可 通过 mmapO 了 映射 操作 将 屏幕 缓冲 区 的 物理 地 址 映射 到 用 
户 空 间 的 一 段 虚 拟 地 址 中 , 之 后 用 户 就 可 以 通过 读 / 写 这 段 虚拟 PET 
WHEW HERR, fEBRSE E?RBd f. "du HOT GERERIUA 
映射 到 同一 个 显示 缓冲 区 。 实 际 上 ， 使 用 帧 缓冲 设备 的 应 用 程 
序 都 是 通过 映射 操作 来 显示 图 形 的 。 
e 1O 控制 : 对 于 帧 缓冲 设备 ， 对 设备 文件 的 ioctlO 操 作 可 读 取 / li 
设置 显示 设备 及 屏幕 的 参数 ， 如 分 辨 率 、 显 示 颜 色 数 、 屏 幕 大 | gamme | 
小 等 。 
如 图 18.6 所 示 ， 在 应 用 程序 中 ， 操 作 /dev/fbn 的 一 般 步 又 如 下 。 EKAI 
(1) 打开 /dev/fbn 设备 文件 。 空间 | 
(2) 用 ioctl0 操 作 取 得 当前 显示 屏幕 的 参数 ， 如 屏幕 分 辨 率 、 每 个 TO 
像素 点 的 比特 数 和 偏 移 。 根 据 屏幕 参数 可 计算 屏幕 缓冲 区 的 大 小 。 用 户 罕 间 的 显示 缓冲 区 
(3) 将 屏幕 绥 冲 区 映射 到 用 户 空间 。 图 18.6 用 户 空间 访问 
(4) 映射 后 就 可 以 直接 读 / 写 屏幕 缓冲 区 ， 进 行 绘图 和 图 片 显 示 了 。 帧 缓冲 设备 流程 
尺码 清单 18.15 所 示 为 一 段 用 户 空间 访问 帧 缓冲 设备 显示 缓冲 区 的 范例 ， 包 含 打 开 和 关闭 
帧 缓冲 设备 、 得 到 和 设置 可 变 参数 、 得 到 固定 参数 、 生 成 与 BPP 对 应 的 帧 缓冲 数据 及 填充 显示 
RX. 





代码 清单 18.15 ”用 户 空间 访问 帧 缓冲 设备 显示 缓冲 区 范例 


#include «unistd.h» 
#include «stdlib.h» 
#include <stdio.h> 
#include «fcntl.h» 
Hull «linux/fb.h» 
#include <sys/mman.h> 
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int main() 


{ 


Int ER e 0s 
struct fb var screeninfo vinfo; 


unsigned long screensize - 0; 
char *fbp - 0; 

Te se c Qn sy ex 

Lx dhoc04 


// Open the file for reading and writing 

fbfd - open("/dev/fb0", O RDWR) ; 

aae Aoc d 
printf("Error: cannot open framebuffer device.Mn"); 
exit(1); 

} 

printf("The framebuffer device was opened successfully. n"); 


// Get variable screen information 

if (ioctl(fbfd, FBIOGET VSCREENINFO, &vinfo)) í( 
printf("Error feading variable intormatrion.iu") 
exit(1); 


printf("$dx$d, $dbppWn", vinfo.xres, vinfo.yres, vinfo.bits per pixel); 

if (vinfo.bits per pixel !- 16) ( 
printf("Error: not supported bits per pixel, it only supports 16 bit color*n"); 
exit (1); 


// Figure out the size of the screen in bytes 


Screensize - vinfo.xres * vinfo.yres * 2; 


// Map the device to memory 


fbp = (char *)mmap(0, screensize, PROT READ | PROT WRITE, MAP SHARED, 
fbtd "00 
if ((int)fbp -- -1) ( 


printf("Error: failed to map framebuffer device to memory. n"); 
exit(4); 
} 


printf("The framebuffer device was mapped to memory successfully. n"); 


// Draw 3 rect with graduated RED/GREEN/BLUE 
Dor ducc Nx GOJpepeep 
fige (uw — db (wubsafolyaame J^ S)5 spo (UL 10) 7^ (wübmto.wee- 4 3)£0 xe) d 
Eor xU 0L Ex EO VLIL Kres? RFE f 
Pongi Ocat Ioni- x E^ MEME O eS 
Ton D ea O (0 
unsigned short rgb; 


if (i == 0) 

xe ee el O 77 VEO "^ SEE 
if (i == 1) 

人 
if (i == 2) 

ig ex (os o 0509). 7 Syagaure osse). "EE 
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mele e (Qe duy J| «e « 5) | 9g 
*((unsigned short*) (fbp * location)) = rgb; 


} 
munmap(fbp, screensize); 


close(fbfd); 


return 0; 




















上述 程序 位 于 虚拟 机 的 /home/lihacker/develop/svn/1dd6410-read-only/tests/framebuffer 中 ， 运 行 
时 会 在 屏幕 上 绘制 R/G/B 这 3 种 颜色 的 由 浅 入 深 的 变化 情况 。LDD6410 的 文件 系统 中 已 经 集成 J 
这 个 fb_test 程序 ， 可 以 直接 运行 查看 效果 。 


18.10 no 图 形 用 户 界面 


18.10.1 Qt-X11/QtEmbedded/Qtopia 


Qt 是 Trolltech ( 奇 趣 科技 , 目前 已 被 诺基亚 收购 ) 公司 所 开发 的 一 个 跨 平台 FrameWork 环境 ， 
它 采 用 类 似 C++ 的 语法 , 在 Microsoft Windows. MacOS X, Linux, Solaris, HP-UX, Tru64 (Digital 
UNIX), Irix, FreeBSD, BSD/OS, SCO, AIX 等 平台 上 都 可 执行 。 

Trolltech 也 针对 斤 入 式 环境 推出 了 Qt/Embedded 产品 。 与 桌面 版 本 不 同 ，Qt/Embedded 未 采 
用 X Server 及 X Library 等 角色 ， 而 是 直接 使 用 帧 缓冲 作为 底层 图 形 接口 (如 图 18.7 所 示 )。 
Qt/Embedded 提供 了 丰富 的 窗口 小 部 件 (Widgets)， 并 且 还 支持 窗口 部 件 的 定制 ， 因 此 它 可 以 为 
用 户 提 供 漂 亮 的 图 形 界面 ， 许 多 基于 Qt 的 X Window 程序 
可 以 非常 方便 地 移植 到 QVEmbedded 版 本 上 。 

Qtopia 是 建立 在 Qt/Embedded 上 的 一 种 开放 源 代码 窗口 
系统 ， 它 与 实际 的 产品 相似 ， 专 门 针 对 PDA, SmartPhone Qt API 
这 类 运行 嵌入 式 Linux 的 移动 计算 设备 和 手持 设备 而 开发 
的 。Trolltech 还 发 布 了 一 款 供 应 用 开发 人 员 使 用 的 Linux F QUXII 
机 “Qtopia Greenphone ". Qt/Embedded QUXIib 

在 宿主 机 上 可 通过 qvfb (虚拟 帧 缓冲 〉 来 模拟 帧 缓冲 。 X Window Server 
qvfb Æ X 窗口 用 来 运行 和 测试 Qtopia 应 用 程序 的 系统 程序 ， 

用 了 共享 存储 区 域 〈 虚 拟 的 帧 缓冲 ) 来 模拟 帧 缓冲 并 UU 
在 一 个 窗口 中 模拟 一 个 应 用 来 显示 帧 缓冲 ， 人 允许 我 们 在 桌面 
及 其 上 开发 Qt BON GERE 
信号 〈Signal) 和 插 模 (Slot〉 是 Qt 中 一 种 用 于 对 象 间 通 信 的 调用 机 制 ， 不 同 于 传统 的 函 
数 回调 方式 ， 信 号 和 插 槽 是 Qt 中 非常 有 特色 的 地 方 ， 是 Qt 编程 区 别 于 其 他 编程 的 标志 。 信 
号 和 插 槽 不 是 标准 C++ 功能 ，C++ 编 译 器 不 能 理解 这 些 语 句 ， 必 须 经 过 特殊 的 工具 对 象 编辑 器 



























































































































































































































































































































































































































































































































































































































































18.7 Qt/Embedded 与 Qt 的 区 别 
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MOC (Meta Object Compiler) 将 源 代码 中 创建 信号 和 插 模 的 语句 翻译 成 C++ 


的 代码 。 


Qt 的 窗 
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这 样 就 可 以 上 
例如 ， 如 


























程序 员 通 过 建立 





























FE sis fie Uo T f 











口 在 事件 发 生 后 会 激发 信号 。 例 如 ， 一 个 按钮 被 点 击 时 会 激发 一 个 “clicked” 信 和 号 。 


























i 完 成 了 
日 对 容易 地 

















ZR 




























































































个 函数 〔 称 做 一 个 插 模 )， 然 后 调用 connect0) 函 数 把 这 个 插 模 和 一 个 信号 连接 
个 事件 和 响应 代码 的 连接 。 信 号 与 插 模 机 制 并 不 要 求 类 之 
开发 出 代码 可 高 重用 的 类 。 





司 互 相知 道 细 节 ， 


























个 退出 按钮 的 clicked0 信 号 被 连接 到 了 一 个 应 用 的 退出 函数 quitO 插 槽 。 那 么 


























个 用 户 点 击 退 出 键 将 使 应 用 程序 终止 运行 ， 完 成 上 述 连接 过 程 的 代码 如 下 。 
button, SIGNAL(clicked()), qApp, SLOT(quit()) ); 
代码 清单 18.16 的 应 用 程序 创建 一 个 hello 窗口 ， 该 窗口 显示 一 个 动态 字符 串 “Hello，World”， 


connect ( 
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程序 中 添加 了 一 个 Qtimer 定时 器 实例 ， 以 周期 性 刷新 屏幕 ， 从 而 得 到 动画 的 效 ? 


代码 清单 18.16 Qt/Embedded 应 用 程序 范例 


dtodd dhe nd aside id 


** 以 下 是 hello.h 的 代码 


Wokdokoiololblopirboreedokokoloioreeedolelokcieiooielolelekeicloesiekekokolokeoeiekekcloreg 


#ifndef HELLO H 
#define HELLO H 
finclude «qvariant.h» 


#include «qwidget.h» 


class QVBoxLayout; 


class OQHBoxLayout; 


class QGridLayout; 


class Hello: 


{ 


ox 


OBJECT public: 


public QWidget 


Hello(QWidget *parent = 0, const char *name = 0, WFlags 


7Hello(); 


// 以 下 是 手动 添加 的 代码 


signals: void clicked(); 





protected: 
void mouseReleaseEvent (QMouseEvent*); 


void paintEvent (QPaintEvent*); 


private slots: 


private: 


; 


OSTEN dep 
xut 


fendif // HELLO.H 


void animate(); 


/ 7E PEPE Ae a ake ae ae ake ae ae ake ae ae ae ae ae ae ae ae ae ake ae ae e ae ae ake aeae aeae aeae ae ake e ake eae ae ake ae ake eae aake aeae eak aake aeae eak ak k k 


xk [i 


下 是 hello.cpp 源 代 码 


opc Ec EE o KK EE E E E EE EE N 


#incl 
#incl 
#incl 
#incl 
#incl 
#incl 
#incl 


ude 
ude 
ude 
ude 
ude 
ude 





ude 


"hello.h" 
«glayout.h» 
«qvariant.h» 
«qtooltip.h» 
«qwhatsthis.h» 
«gpushbutton.h» 
«qtimer.h» 


~o 


fl = 0); 
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e 
Q 

38 #include «qpainter.h» Q 

39 #include «qpixmap.h» 

40 /* 构造 一 个 Hello Bil */ 

41 Hello::Hello(QWidget *parent, const char *name, WFlags fl): QWidget (parent, 

42 name, fl) 

43 { 

44 if (!name) 

45 setName ("Hello"); 

46 resize(240, 320); 

47 setMinimumSize (QSize(240, 320)); 

48 setMaximumSize (QSize(240, 320)); 

49 setSizeIncrement(QSize(240, 320)); 

50 setBaseSize(QSize(240, 320)); 

Sal OPalette pal; 

52 QColorGroup cg; 

53 cg.setColor(QColorGroup::Foreground, black); 

54 cgasetcolor(0ColonGroup::Buttonyj"00olon(0927 927 592) 

55; cg.setColor(QColorGroup::Light, white); 

36 corset Color oon oup mci ne MEO oto 22 OPE OP MEDI 

53 msc oon ol eu e UI EH au ‘Ober EG ME OO PEINE: 

58 co -rexexeterollons (OCONOn el ul Vi Xorcekess (159). 19. 1595) 

nd cg.setColor(QColorGroup::Text, black); 

60 cg.setColor(QColorGroup::BrightText, white); 

61 cg.setColor(QColorGroup::ButtonText, black); 

62 cg.setColor(QColorGroup::Base, white); 

63 cg.setColor(QColorGroup::Background, white); 

64 cg.setColor(QColorGroup::Shadow, black); 

65 cg.setColor(QColorGroup::Highlight, black); 

66 cg.setColor(QColorGroup::HighlightedText, white); 

67 pal.setActive (cg); 

68 cg.setColor(QColorGroup::Foreground, black); 

69 ose olio 9e olent m 9 ole Eo MENIEO MIRO YN 

70 cg.setColor(QColorGroup::Light, white); 

ait cose oom oon oup gb EO ote 2/210» 0 > 20 

n2 msc oou ol eu us e UI EH at ME C XI oS S OI PME NET 

ES Ge -Saar (tore ves QConm (L2). 1295 d 259) 5 

74 cg.setColor(QColorGroup::Text, black); 

145) cg.setColor(QColorGroup::BrightText, white); 

76 cg.setColor(QColorGroup::ButtonText, black); 

yu cg.setColor(QColorGroup::Base, white); 

78 cg.setColor(QColorGroup::Background, white); 

9 cg.setColor(QColorGroup::Shadow, black); 

80 cg.setColor(QColorGroup::Highlight, black); 

81 cg.setColor(QColorGroup::HighlightedText, white); 

82 pal.setInactive (cg); 

83 cg.setColor(QColorGroup::Foreground, QColor(128, 128, 128)); 

84 Ge SetColor (OOo eo Bb m e 9 oto tor Mo NIKON 

85 cg.setColor(QColorGroup::Light, white); 

86 cose olo ol one euis cibi gt e 9 o om220 8522/0 9 22/0) 

87 Co ene Lleol er Dr OS oleo SOC NEIGE 

88 Go eeeenlor (OorerEr euis Mid EO oem EB EI PIN 

89 cg.setColor(QColorGroup::Text, black); 

90 cg.setColor(QColorGroup::BrightText, white); 

Os cg.setColor(QColorGroup::ButtonText, QColor(128, 128, 128)); 

9 cg.setColor(QColorGroup::Base, white); 
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93 cg.setColor(QColorGroup::Background, white); 
94 cg.setColor(OColorGroup::Shadow, black); 
95 cg.setColor(QColorGroup::Highlight, black); 
96 cg.setColor(QColorGroup::HighlightedText, white); 
e) pal.setDisabled(cg); 
98 setPalette (pal); 
29 QECnEe (Eon (0) )) 9 
00 f.setFamily("adobe-helvetica"); 
01 f.setPointSize(29); 
02 f.setBold (TRUE); 
03 setFont(f); 
04 ets eati nte PET 
05 t = "Hello,World"; 
06 b = 0; 
07 Gmimern *rimer = new OTtimer(this); / /创建 定时 器 
08 connect (timer, SIGNAL(timeout()), SLOT(animate())); // 连 接 信号 和 插 槽 
09 timer-»start (40); 
ONE 
Efi 
2 /* 销毁 对 象 ， 释 放任 何 被 分 配 的 资源 */ 
SL de(ebdkejs S. Herota 
4 
5 /* 每 次 定时 器 到 期 后 调用 插 模 */ 
6 void Hello::animate() 
Jo 
8 ijo e (deor JD) S9 
9 repaint(FALSE); M/E 
2/05) 
21 
22 /* AbH hello 窗口 的 鼠标 按钮 释放 事件 */ 
23 void Hello::mouseReleaseEvent (QMouseEvent *e) 
24 
25 if (rect().contains (e-»pos()) 
26 emit clicked(); // 激 活 clicked (fd 
25H 
28 
29 /* 处 理 hello 窗口 的 重 绘 事件 */ 
30 void Hello::paintEvent (QPaintEvent* 
Sub c 
32 static int sin tbl[16] = 
33 
34 O 39; a €. 100, 92. qi. Se 0 ci009. 92. 
35 = ces 
36 ; 
St (eS ny 
38 return ; 
39 VY 3g yip SES TUI 
40 OFontMetrics fm = fontMetrics(); 
41 int w —- fm.width(t) -* 20; 
42 int h - fm.height() *2; 
43 ime gons = weld) / Zw $5 mE 
44 ime qom = loue) y Z-- / 2. 
45 // 2: 创建 pixmap， 用 窗口 背景 填充 它 
46 QPixmap pm(w, h); 
47 E eE eae ae pmylt 
466 INUX 
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48 // 3: 绘制 pixmap 

49 QPainter p; 

50 int x = WO, 

M int y » h / 2«£m.descent() ; 

52 int i - 0; 

53 p.begin(&pm); 

54 p.setFont(font()); 

Bs while (!t[i].isNull() 

56 ( 

SEN sbenr. all -— (doy 3E 3L) dl 

58 oneee Pan OCE 5o o SIG 2597 256 (C CTI SESS RET 
9 jor eien esso ea lll vie ^ QOL. eana eua JL e 
60 se «e denne vache (Ge [Lac] g 

61 Jes 

62 } 


63 p.end(); 

64 // 4: 复制 pixmap $J Hello fi 
(59: JorwEnie (tieu. own. Jonüyr 9nd) 
66 ] 

67 


人 6 8 / EP a keak eak eae keak e ak eak 3e ak 3e ak eak 3e ak 3e ak eak ake ak 3e ak eak ae ak ae ak eak keak e ak ea e ae ak 


69 ** 以 下 是 main. cpp 的 源 代码 


























71 #include "hello.h" 

72 $include «qapplication.h» 
quer Res 
74 The program starts here. It parses the command line and builds a message 
75 string to be displayed by the Hello widget. 

349. owl 

77 $define QT NO WIZARD 

Je aene. menn ine mleyo, (laus. ee) 














HS 

80 QApplication a(argc, argv); 

81 Hello dlg; 

82 QObject::connect(&dlg, SIGNAL(clicked()), &a, SLOT(quit())); 
83 a.setMainWidget(&dlg); 

84 dlg.show(); 

85 return a.exec(); 

SIN 


18.10.2 Microwindows/Nano-X 
Microwindows Æ HAN X A St 73 18 RH ES] — PR SUE HI P REDI, UELUT Es http://www. 
microwindows.org, Microwindows 完全 支持 Linux 的 帧 缓冲 技术 。 这 个 项 目的 早期 目标 是 在 嵌入 式 
Linux 平台 上 提供 和 普通 个 人 电脑 上 类 似 的 图 形 用 户 界面 。 
Microwindows 起 源 于 NanoGUI 项 目 , 早期 Microwindows 有 两 个 版 本 , 一 个 版 本 包含 了 一 组 
和 微软 的 WIN32 图 形 用 户 接 口 相似 的 API， 这 个 版 本 就 是 Microwindows 版 本 ; 男 外 一 个 版 本 是 
基于 X-Windows 的 一 组 Xlib 风格 的 API 函数 库 ， 这 个 版 本 允许 X11 的 二 进 制 代码 直接 在 Micro 
Windows 的 Nanx-X 服务 器 上 运行 ， 称 之 为 Nano-X。 
如 图 18.8 所 示 ，Microwindows 采用 分 层 设 计 方 法 。 在 最 底层 ， 屏 幕 、 鼠 标 / 触 摸 屏 以 及 键盘 
驱动 程序 提供 了 对 物理 设备 访问 的 能 力 。 在 中 间 层 ， 实 现 了 一 个 可 移植 的 图 形 引 擎 ， 支 持 行 绘 玮 
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区 域 填 充 、 剪 切 以 及 颜色 模型 等 。 在 上 层 ， 实 现 多 种 API 以 适应 不 同 的 应 用 环境 。 


应 用 程序 





















提供 库 btrwidget.s 提供 库 bibemon-Xa 


nm 


提供 库 bibemonfont.a 









提供 库 bibmengioca 
图 层 引 擎 层 
MicroWindows 
提供 库 bibmengioca 内 部 结构 
系统 内 核 





Frametoffer 
驱动 


18.8 Microwindows 的 层次 结构 



































代码 清单 18.17 所 示 为 一 个 简单 的 Microwindows 应 用 程序 ， 它 基于 Nano-X API 编写 ， 创 建 
个 窗口 并 显示 “Hello World”， 如 图 18.9 所 示 。 


















































代码 清单 18.17 Nano-X 应 用 程序 范例 









































1 finclude <stdio.h> 

2 #include «microwin/nano-X.h» 

3 

4 GR WINDOW ID wid; 

5 CRCC iD GE} 

6 

7 void event handler(GR EVENT *event); 

8 

9 int main(void) 

0 d 

JL if (GrOpen() « 0) 

D { 

3 fprintf(stderr, "GrOpen failed"); 

4 exit(1); 

5 ] 

6 

7) gc = GrNewGC(); 

8 GrSetGCForeground(gc, OxFF0000); 

9 // 创 建 窗 

20 wid = GrNewWindowEx (GR WM PROPS APPFRAME | 
2 GR WM PROPS CAPTION | 
22 GR WM PROPS CLOSEBOX, 
23 DIEI mc cn E S ESSE CO CO TSVEISINTI CO WIRT (0 O PREZZO 
24 200,0xFFFFFF); 

25 ”// 选 择 事件 

26 GrSelectEvents (wid, GR EVENT MASK CLOSE REQ|GR EVENT MASK EXPOSURE); 
2 

28 GrMapWindow (wid); 
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29  GrMainLoop(event handler); // 挂 接 事件 处 理 函 数 
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39 y 

SU 

32 void event handler (GR EVENT *event) 

sie 

34 Switch (event-»type) 

35 { 

36 case GR EVENT TYPE EXPOSURE: // 显 示 文 本 
Sm GETE (miel. (exe. S 30. VWJselbte: WiesslhoU. c db. (Cj unm NSYOU) E 
38 break; 

39 case GR EVENT TYPE CLOSE REQ:  // 关 闭 
40 GrClose(); 

41 exit(0); 

42 default: 

43 break; 

44 t 

45 } 








18.9 Microwindows 使 用 范例 


18.10.3 MiniGUI 

MiniGUI Æ Hid tC 1 P ETSCRAH BR ZA 8] JT AES T I8] CEST RUN RR EET ee EK SEE HH P? ZR 
文 持 系统 ，1999 年 初 遵循 GPL 条 款 发 布 第 一 个 版 本 以 来 ， 已 广泛 应 用 于 手持 信息 终端 、 机顶盒 、 
工业 控制 系统 及 工业 仪表 、 彩 票 机 、 人 金融 终端 等 产品 和 领域 。 目 前 ，MiniGUI 已 成 为 跨 操 作 系统 
的 图 形 用 户 界 面 支持 系统 ， 可 在 Linux/uClinux、eCos、UuC/OS-II、VxWorks 等 操作 系统 上 运行 ， 
已 验证 的 硬件 平台 包括 Intel x86、ARM、PowerPC、MIPS 和 M68K (DragonBall/ColdFire) 等 。 
[图 18.10 所 示 ， 基 于 MiniGUI 的 应 用 程序 一 般 通 过 ANSI C 库 以 及 MiniGUI 自身 提供 的 API 
来 实现 自己 的 功能 ，MiniGUI 中 的 可 移植 层 可 将 特定 操作 系统 及 底层 硬件 的 细节 隐藏 起 来 ， 而 上 
层 应 用 程序 则 无 须 关 心底 层 的 硬件 平台 输出 和 输入 设备 。 

为 了 适合 不 同 的 操作 系统 环境 ，MiniGUI 可 配置 成 以 下 3 种 运行 模式 。 
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1. MiniGUI-Threads 
运行 在 MiniGUI-Threads 上 的 程序 可 以 在 不 同 的 线程 中 建立 多 个 窗 















































口 ， 但 所 有 的 窗口 




















在 





个 进程 








或 者 地 址 空间 中 运行 。 这 种 运行 模式 非常 适合 于 大 多 数 传统 意义 上 的 嵌入 式 操 作 系统 ， 比 如 wC/OS-IL、 














eCos, VxWorks, pSOS 等 。 当 然 ， 在 Linux flluClinux E, 
MiniGUI 也 能 以 MiniGUI-Threads 模式 运行 。 

2. MiniGUI-Processes 

和 MiniGUI-Threads 4H/x., MiniGUI-Processes 上 的 每 





MiniGUI 应 用 程序 












MiniGUI 
示 准 C 
可 移植 层 di 
I 


























个 程序 是 单独 的 进程 ， 每 个 进程 也 可 以 建立 多 个 窗口 ， 并 
且 实 现 了 多 进程 窗口 系统 。MiniGUI-Processes 适合 于 具有 





























设备 









































Linux、eCos、VXWorks 等 





T 











完整 UNIX 特性 的 嵌入 式 操作 系统 ， 比 如 嵌入 式 Linux。 i 


3. MiniGUI-Standalone 
在 这 种 运行 模式 下 ，MiniGUI 可 以 以 独立 进程 的 方 


18.10  MiniGUI 和 嵌入 式 操 


























式 运行 ， 既 不 需要 多 线程 也 不 需要 多 进程 的 支持 ， 这 种 运行 模式 适合 功能 单一 的 应 用 ] 









































MiniGUI 下 的 通信 是 一 种 类 似 于 Win32 的 消息 机 制 ， 如 果 有 Win32 图 形 用 户 界 本 
基础 ， 编 写 MiniGUI 程序 将 没有 门槛 。 代 码 清单 18.18 所 示 为 一 个 完 





















































作 系 统 的 关系 
























































整 的 MiniGUI 应 





k 合 5 
程序 的 编程 
程序 ， 该 






















































































world!”， 如 图 18.11 所 示 。 





代码 清单 18.18 MiniGUI 应 用 程序 范例 
















































































1 finclude <stdio.h> 
2 4include «minigui/common.h» 
3 4include «minigui/minigui.h» 
4 #include «minigui/gdi.h» 
5 #include «minigui/window.h» 
6 static int HelloWinProc ( HWND hWnd, int message, WPARAM wParam, LPARAM lParam ) 
Y 3 
8 HDC hdc; 
9 Switch (message) 
0 ( 
HJ case MSG PAINT: 
2 hdc = BeginPaint (hWnd); 
3 TextOut(hdc, 60, 60, "Hello world!");// 输 出 文本 
4 EndPaint(hWnd, hdc); 
D return 0; 
6 case MSG CLOSE: 
7 DestroyMainWindow (hWnd) ;/ /破坏 窗 
8 PostQuitMessage (hWnd); // 释 放 退 出 消息 
9 return 0; 
20 } 
2 return DefaultMainWinProc(hWnd, message, wParam, lParam); 
22 
2i 
24 int MiniGUIMain(int argc, const char *argv[]) 
AD 
26 MSG Msg; 
2p HWND hMainWnd;//3Ef& Fit 
28 MAINWINCREATE CreateInfo; 





程序 在 屏幕 上 创建 一 个 大 小 为 240x180 的 应 用 程序 窗口 ， 并 在 窗口 客户 区 的 中 部 显示 “Hello 








(09 OSEO CO OA CONES) 
o 4» 0 D S Oo to 
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XO. (OO. I s. 


E e pe e p 6 
Oo re COO ux WATS AG 





O10 UO UU A 
in iw GO PO PS OQ 


56 


oa 
- 


#ifdef | MGRM PROCESSES 


JoinLayer (NAME DEF LAYER, 


#endif 
Creare 
Create 
Create 
Create 
Create 
Create 
Create 
Create 
Create 
Create 
Create 
Create 
Create 
Create 





nfo.hMenu 


nfo.dwStyle = W 
nfo.dwExStyle - 
nfo.spCaption - 


= 0; 


nfo.dwAddData - 0; 
nfo.hHosting - 
hMainWnd = CreateMainWindow(&CreateInfo); // 创 建 3 
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"melloworle .0 Oy 


S VISIBLE | WS BORDER | WS. CAPTION; 


WS EX NONE; 
"HelloWorld"; 


























HWND. DESKTOP; 


if (hMainWnd == HWND INVALID) 


return 


= ilg 


ShowWindow (hMainWnd, S 
(GetMessage(&Msg, hMainWnd)) 


while 





W SHOWNORMAL); 


TranslateMessage (&Msg); / / Ñ A VERO 
DispatchMessage(&Msg); // 派 送 消息 


} 


MainWindowThreadCleanup (hMainWnd); 


return 0; 


18.10.4 Android 


Android 是 google JÉEtHES—4 eA AS. H 
FIRME CMiddleWare) 和 应 


n 





nfo.hCursor = GetSystemCursor(0); 
































poSo ien = 05 

nfo.MainWindowProc = HelloWinProc;// 主 窗口 消息 处 理 程序 
nfo.lx e 0; 

mtosty 9 0 

morz = 240p //AOKSERSI 

nfo.by = 180; // ENR 

nfo.iBkColor - COLOR lightwhite; 








S 
y 











FF 





























下 而 上 分 为 以 下 几 个 层次 。 


(1) 操作 系统 
(2) 和 名利 











E (OS). 
HÆ (Libraries) 和 Android 运行 时 (RunTime)。 























程序 (Application)。 根 据 Android 的 软件 框图 ， 其 软件 层次 结构 


图 18.11 


HelloWorld 


Hello world! 





MiniGUI 使 用 范例 














软件 层次 结构 包括 了 一 个 操作 系统 (OS)， 
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(3) 应 用 程序 框架 (Application Framework). 

(4) 应 用 程序 (Applications ) 。 

Android 的 应 用 程序 主要 涉及 用 户 界 面 ， 通 常 以 Java 程序 编写 Android 本 身 提 供 了 主屏 幕 (Home), 
联系 人 、 电 话 、 浏 览 器 等 众多 的 核心 应 用 。 同 时 应 用 程序 的 开发 者 还 可 以 使 用 应 用 程序 框架 层 的 API 
实现 自己 的 程序 。 目 前 Android 的 应 用 开发 非常 热门 ， 已 有 大 量 文 档 和 书籍 讲解 ， 本 书 不 再 歼 述 。 

LDD6410 整合 了 Android 1.6，LDD6410 的 Android 本 身 作 为 Linux 文件 系统 的 一 部 分 进行 管 
理 。 在 系统 启动 后 ， 运 行 根 目 录 下 的 android， 系 统 将 进入 Android (如 图 18.12 所 示 )。LDD6410 
Android 支持 按键 、 触 摸 屏 和 鼠标 操作 , 显示 设备 可 以 是 LCD(480*272) 和 VGA(C1024*768@ 60Hz). 
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18.12 LDD6410 Android 界面 














在 本 书 配套 光盘 中 提供 了 Android 1.6 SDK android- sdk- linux. x86- 1.6 rl.tgz, 使 用 该 SDK 就 可 
以 生成 支持 LDD6410 的 Android, EUR: 
(1) 在 PC 上 创建 LDD6410 虚拟 机 。 


lihackerGlihacker - laptop: ~ /develop/LDD6410/android - sdk - linux x86 - 1.6 r1/ 
tools$ ./android create avd -n LDD6410 -t 2 
Android 1.6 is a basic Android platform. 











Do you wish to create a custom hardware profile [no]y 

Device ram size: The amount of physical RAM on the device, in megabytes. hw.ramSize 
ILS] 8 1.29) 

Touch-screen support: Whether there is a touch screen or not on the device. 

hw.touchScreen [yes]: 

Track-ball support: Whether there is a trackball on the device. hw.trackBall [yes]:n 

Keyboard support: Whether the device has a QWERTY keyboard. 

hw.keyboard [yes]:n 

DPad support: Whether the device has DPad keys hw.dPad [yes]:y 

GSM modem support: Whether there is a GSM modem in the device. 
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hw.gsmModem [yes]:n 


eo 


Camera support: Whether the device has a camera. hw.camera [no]:n 

Maximum horizontal camera pixels 

hw.camera.maxHorizontalPixels [640]: Maximum vertical camera pixels Hhw.camera. 
maxVerticalPixels [480]: 

GPS support: Whether there is a GPS in the device. 

hw.gps [yes]:n 

Battery support: Whether the device can run on a battery. hw.battery [yes]:n 

Accelerometer: Whether there is an accelerometer in the device. 

hw.accelerometer [yes]:n 

Audio recording support: Whether the device can record audio hw.audioInput [yes]: 

Audio playback support: Whether the device can play audio 

hw.audioOutput [yes]: 

SD Card support: Whether the device supports insertion/removal of virtual SD Cards. 
hw.sdCard [yes]: 

Cache partition support: Whether we use a /cache partition on the device. 

disk.cachePartition [yes]:n 

Cache partition size disk.cachePartition.size [66MB]: 

Abstracted LCD density: Must be one of 120, 160 or 240. A value used to roughly describe 
the density of the LCD screen for automatic resource/asset selection. 

hw.lcd.density [160]: 

Created AVD 'LDD6410' based on Android 1.6, with the following hardware config: 

hw.gps-no hw.dPad-yes hw.accelerometer-no hw.lcd.density-160 disk.cachePartition-no 
hw.keyboard-no hw.trackBall-no hw.ramSize-128 hw.gsmModem-no hw.camera-no hw.battery-no 


(20 在 主机 上 创建 一 个 sd card 的 image. 
sudo ./mksdcard 128M sdcard.img 


(3) 在 主机 上 启动 Android 模拟 器 ， 运 行 如 下 命令 启动 LDD6410 虚拟 机 ， 如 图 18.3 所 示 : 


sudo ./emulator -sdcard ./sdcard.img @LDD6410 
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18.13 Android 虚拟 机 界面 
启动 adb shell 连接 LDD6410 虚拟 机 ， 查 看 模拟 器 目标 机 上 文件 系统 的 挂 载 情况 : 


# mount 
































noctcN roots rono 





LINUX, 173 





Linux 设备 驱动 开发 详解 (第 2 版 ) 





tmpfs /dev tmpfs rw,mode-755 0 0 

devpts /dev/pts devpts rw,mode-600 0 0 

J Oe Oe jenctoxe. sew, (0r (0 

sysfs /sys sysfs rw Q 0 

tmpfs /sqlite stmt journals tmpfs rw,size-4096k 0 0 

/dev/block/mtdblock0 /system yaffs2 ro 0 0 

/dev/block/mtdblockl /data yaffs2 rw,nosuid,nodev 0 0 

/ dev/block//vold/179:0 /sdcard vfat rw,dirsync,nosuid,nodev,noexec, uid-1000,gid-1015, fmask- 
0702,dmask-0702,allow utime-0020,c odepage-cp437,iocharset-iso8859-1,shortname-mixed,utf8 0 0 


(4) 提取 Android 1.6. 

把 busybox 放 入 模拟 器 目标 机 文件 系统 ! 
./adb push ~/develop/svn/1dd6410/utils/busybox-1.15.1/ install/bin/busybox /data 
311] SL TE dE /system. /data. /sbin 目录 以 及 根 目 录 下 的 init. initre 等 都 放 入 sdcard 的 

image ! 

/data/busybox tar cvf /sdcard/android.tar /data /system /sbin /sqlite stmt journals 


















































f nae sere. 

/init.goldfish.rc /init 

进入 /sdcard 目录 看 看 得 到 的 压缩 文件 : 
cd /sdcard 

dte dL 

beequpcrex System. wdedrd rw 904987552 2010-01-30 12:257 androld.tar 


在 主机 上 以 loop 方式 mount sdcard 的 image， 并 将 里 面 的 文件 放 到 LDD6410 目标 电路 板 的 根 
文件 系统 即 可 。 
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S3C6410 内 部 集成 了 显示 控制 器 ， 它 可 以 将 局 部 总 线 上 来 自 后 处 理 器 (POST Processor) 的 图 
像 数据 和 系统 内 存 中 的 视频 缓冲 传输 到 外 部 的 LCD 接口 上 。 图 18.14 给 出 了 S3C6410 显示 控制 器 
的 框图 , 其 LCD 接口 支持 4 种 模式 : 传统 的 RGB 接口 、I80 接口 、NTSC/PAL 标准 电视 接口 和 IT-R 
BT. 601 接口 。 显 示 控 制 器 针对 视频 数据 的 端口 包括 RGB VD[23:0. SYS VD[17:0]fll TV OUT. 
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18.14. S3C6410 显示 控制 器 逻辑 结构 
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LDD6410 开发 板 上 可 连接 外 部 VGA 显示 器 和 东 华 、 群 创 等 LCD，VGA 部 分 透 过 ADV7123 
芯片 进行 数字 信号 向 模拟 信和 号 的 转换 ， 连 接 LCD 则 无 需 此 转换 过 程 ， 图 18.15 所 示 LDD6410 F 
发 板 上 S3C6410 芯片 外 围 的 LCD 接口 信号 。 
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18.15. S3C6410 芯片 外 围 的 LCD 接口 信号 








在 本 书 配套 光盘 Linux 2.6.28 内 核 源 代码 的 drivers/video/samsung 目录 下 ,包含 了 S3C6410 
的 LCD 驱动 。 核 心 的 工作 由 s3cfb.c、s3cfb_fimd4x.c 等 文件 进行 了 实现 ， 这 些 文件 实现 的 主体 内 
容 是 实现 了 framebuffer 设备 的 注册 、 注 销 以 及 其 中 的 fb. ops 的 功能 函数 ， 代 码 清单 18.19 抽取 了 
s3cfb.c 的 框架 。 
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代码 清单 18.19 S3C6410 LCD 控制 器 驱动 


dL Seon Je) (SIS eel oo -— i 
2 .owner = THIS MODULE, 


3 .fb check var - s3cfb check var, 
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4 .fb set par = s3cfb set par, 
i) 38e) Jejlcus)« = SSe noole, 
6 .fb pan display- s3cfb pan display, 
7 .fb setcolreg = s3cfb setcolreg, 
8 afb fillrect = Qf fILllrect, 
9 .fb copyarea = cfb copyarea, 
0 .fb imageblit = cfb imageblit, 
1 #ifdef CONFIG FRAMEBUFFER CONSOLE 
2 ED CUrSOr= SOFE en 
3 #endif 
A EO roct —: SS CEbuioCEl 
SE 
6 
ee ne void deel onie El (Cs El imio e Tfinfo. char *tudrvouame. inb zndex) 
$ 1 
Ore 
20M En El elo oe NS SSCIBIONOI) S 
Zl es 
DDE 
22 
24 static int | init s3cfb probe(struct platform device *pdev) 
252 
AE 
27 fbinfo = framebuffer alloc(sizeof(s3cfb info t), &pdev->dev); 
DUST Tere 
29 s3cfb init fbinfo(&s3cfb info[index], driver name, index); 
30 
31 ret - s3cfb init registers(&s3cfb info[index]); 
32 ret = s3cfb check var(&s3cfb info[index].fb.var, &s3cfb info[index].fb); 
93 
34 ret = register framebuffer(&s3cfb info[index].fb); 
OO 
SION 
37 
38 static int s3cfb remove(struct platform device *pdev) 
ONE 
40 
41 unregister framebuffer(&info[index].fb); 
42 
43 return O0; 
44 ) 
45 
46 static struct platform driver s3cfb driver - ( 
47 .probe = s3cfb probe, 
48 .remove = s3cfb remove, 
49 .suspend = s3cfb suspend, 
50 .resume = s3cfb resume, 
31 .driver = { 
52 . name SC OC 
59 .owner = THIS MODULE, 
54 ), 
S9- Jy 
56 
Ey aba Wolseley eeo nic (uou) 
Se dq 
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59 return platform driver register(&s3cfb driver); 
GONE 

61 static void exit s3cfb cleanup (void) 

62 ( 

63 platform driver unregister(&s3cfb driver); 

64 ] 
65 
66- modale nit(t ot INIER? 


eoo 


67 module exit(s3cfb cleanup); 

于 通用 的 文件 实现 了 核心 的 工作 ， 对 于 具体 的 LCD 面板 和 VGA 而 言 ， 我 们 只 需要 进行 定 
时 和 硬件 参数 的 配置 了 。LDD6410 开发 板 的 东 华 4.3 寸 LCD 面板 〈 分 辨 率 为 480*272) 的 配 
件 位 于 drivers/video/samsung/ s3cfb_wanxin.c， 其 代码 如 清单 18.20。 
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代码 清单 18.20 LDD6410 外 接 东 华 4.3 寸 LCD 面板 配置 






































1 define S3CFB HFP 2. 4 igiene. oaea ey 
2 define S3CFB HSW 4L 5 Jade wie le 
3 define S3CFB HBP 2. 7/9 Jeyexel's oO e 
4 
5 define S3CFB VFP 2 j^ Ee pexoxercdm E 
6 define S3CFB VSW 10 J usare. Ma Ee o 
3i define S3CFB VBP 2 week ue 
8 
9 define S3CFB HRES 480 / ale ODn pee e SIN el 
0 4$define S3CFB VRES DI cut LUIS re y resolution */ 
T 
2 #define S3CFB_HRES_VIRTUAL 480 Js Me i oe 5x eo et a 
3 4$define S3CFB VRES VIRTUAL (272*2)/* line cnt y resolution */ 
4 
5 #define S3CFB HRES OSD 480 和 
6 #define S3CFB VRES OSD 272 yt line cnt y resolution */ 
Fi 
8 #define S3CFB VFRAME FREQ 60 /* frame rate freq */ 
9 
20 4$define S3CFB PIXEL CLOCK (S3CFB VFRAME FREQ * (S3CFB HFP + S3CFB HSW + S3CFB HBP \ 
2 * S3CFB HRES) * (S3CFB VEE 4 S3CFB VSW t S3CFB VBP -« S3CFB VRES)) 
22 
23 static void s3cfb set fimd info(void) 
24 
2:5 
26 
24] 
28 int s3cfb wanxin set gpio (void) 
29 
30 
3L cetur 0: 
22 
29) 
34 
Si waoaiel mese Init tL 
3I. dq 
BA printk(KERN INFO "WANXIN LCD will be initializedWin"); 
38 


EL CINGUNT OR (DN 
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40  s3cfb wanxin set gpio(); 
Ad jg 


S3CFB HFP,. S3CFB HSW., S3CFB HBP, S3CFB VFP, S3CFB VSW., S3CFB VBP 等 
宏 的 值 都 直接 取材 于 该 款 LCD 面板 的 数据 手册 中 的 7.4.2 节 ， 如 图 18.16 所 示 。 
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7.4.2 Timing Requirement 1 
Parameter Symbol Min. Typ. Max. Unit 
Clock cycle fcrx - 9 15 MHz 
Hsync cycle 1/th - 17.14 - KHz 
Vsync cycle 1/tv - 59.94 - Hz 
Horizontal Signal 
Horizontal cycle th? - 525 - CLK 
Horizontal display period thd | - | 480 - CLK 
Horizontal front porch thf 2 | - - CLK 
Horizontal pulse width thp 2 41 - CLK 
Horizontal back porch thb 2 2 - CLK 
Vertical Signal | | 
Vertical cycle tv - 286 H 
Vertical display period tvd - 272 H 
Vertical front porch tvf 1 2 H 
Vertical pulse width tvp 1 10 H 
Vertical back porch tvb 1 2 H 
Note: 
(1) thd-480CLK, thf-2CLK, thp-41CLK, thb-2CLK, thf + thp + thb > 44CLK. (CLK=1/ fCLK ,H-th) = 


18.16 LDD6410 外 接 东 华 4.3 T LCD 面板 的 定时 表 














LDD6410 开发 板 外 接 VGA 显示 器 的 配置 文件 位 于 drivers/video/samsung/ s3cfb_vga.c， 其 中 
的 S3CFB HFP, S3CFB _HSW、S3CFB HBP、S3CFB VFP、S3CFB VSW、S3CFB_VBP 等 宏 
的 取 值 则 直接 来 源 于 VESA 视频 电子 标准 协会 ) 工业 标准 。 
光盘 中 附带 的 LDD6410 工程 源 代码 下 的 tests/framebuffer/fb_test.c 文件 实现 了 在 电路 板 的 
4.3 `F LCD 显示 器 和 1024*768 分 辨 率 VGA 显示 器 上 绘制 色彩 渐变 的 R、G、B 三 色 和 矩形 框 的 
源 代 码 ， 可 以 作为 进一步 学 习 framebuffer 用 户 空 间 编 程 的 实例 。 


I MP = 


帧 缓冲 设备 是 一 种 典型 的 字符 设备 ， 它 统一 了 显存 ， 将 显示 缓冲 区 直接 映射 到 用 户 空 间 。 
帧 缓冲 设备 驱动 fle_operations 中 VFS 接口 函数 由 fbmem.c 文件 统一 实现 。 这 样 ， 驱 动工 程 师 
的 工作 重点 将 是 实现 针对 特定 设备 fb info 中 的 fb ops 的 成 员 函 数 , 另外, 理解 并 能 灵活 地 修改 
fb info 中 的 var 和 fix 参数 非常 关键 。fb_info 中 的 var 参数 直接 和 LCD 控制 器 的 硬件 设置 以 及 
LCD 屏幕 对 应 。 

在 用 户 空 间 ， 应 用 程序 直接 按照 预先 设置 的 R、G、B 位 数 和 偏 移 写 经 过 mmap(O 了 映射 后 的 显 
示 缓 冲 区 就 可 实现 图 形 的 显示 ， 省 去 了 内 存 从 用 户 空间 到 内 核 空 间 的 复制 过 程 。 
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Flash 在 嵌入 式 系统 中 是 必 不 可 少 的 ， 它 是 BootLoader. Linux 内 核 和 
文件 系统 的 最 佳 载体 。 在 Linux 内 核 中 ， 引 入 了 MTD 层 为 NOR Flash 和 
NAND Flash 设备 提供 统一 的 接口 ， 从 而 使 得 Flash 驱动 的 设计 工作 大 为 
简化 。 

19.1 节 讲解 了 Linux Flash 驱动 的 结构 ， 主 要 讲解 了 MTD 系统 的 层次 结 
构 和 接口 。 

19.2 节 和 19.3 节 分 别 讲解 了 NOR Flash 和 NAND Flash 驱动 的 设计 方 
法 ， 给 出 了 设计 模板 。 

19.4 节 和 19.5 节 分 别 以 S3C6410 外 围 NOR Flash 和 NAND Flash 为 






















































































实例 进一步 讲解 了 NOR Flash 和 NAND Flash 驱动 的 设计 。 
19.6 节 讲 解 了 如 何在 Flash 上 建立 cramfs、jffs/jffs2、yaffs/yaffs2 及 
ubifs 文件 系统 。 
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Linux Flash 驱动 结 


19.1.1 Linux MTD 系统 层次 

在 Linux 系统 中 ， 提 供 了 MTD (Memory 
Technology Device， 内 存 技术 设备 ) 系统 来 建立 
Flash 针对 Linux 的 统一 、 抽 象 的 接口 。MTD 将 
文件 系统 与 底层 的 Flash 存储 器 进行 了 隔离 , 使 
Flash 驱动 工程 师 无 须 关心 Flash 作为 字符 设备 
和 块 设备 与 Linux 内 核 的 接口 。 
如 图 19.1 所 示 , 在 引入 MTD 后 , Linux 













根 文件 系统 文件 系统 
































字符 设备 节点 块 设备 节点 























MTD 字符 设备 MTD 块 设备 





























MTD 原始 设备 
系统 中 的 Flash 设备 驱动 及 接口 可 分 为 4 层 ， 
LAIRI E., WR E "P E BEEN 
从 上 到 下 依次 是 : 设备 节点 、MTD 设备 层 、 Flash SESS 





MTD 原始 设备 层 和 硬件 驱动 层 ， 这 4 层 的 
作用 如 下 。 
e 硬件 驱动 层 : Flash 硬件 驱动 层 负责 Flash 硬件 设备 的 读 、 写 、 擦 除 ，Linux MTD 设备 的 
NOR Flash 心 片 驱动 位 于 drivers/mtd/chips 子 目录 下 ，NAND 型 Flash 的 驱动 程序 则 位 于 
/drivers/mtd/nand 子 目 录 下 。 
@ MTD 原始 设备 层 : MTD 原始 设备 层 由 两 部 分 组 成 ， 一 部 分 是 MTD 原始 设备 的 通用 代 
码 ， 另 一 部 分 是 各 个 特定 的 Flash 的 数据 ， 例 如 分 区 。 
€ MTD 设备 层 : 基于 MTD 原始 设备 ，Linux 系统 可 以 定义 出 MTD 的 块 设备 〈 主 设备 号 
31) 和 字符 设备 (设备 号 90)， 构 成 MTD 设备 层 。MTD 字符 设备 的 定义 在 mtdchar.c 
中 实现 ， 通 过 注册 一 系列 file operation 函数 (lseek、open、close、read、write、ioctl) 
可 实现 对 MTD 设备 的 读 写 和 控制 。MTD 块 设备 则 是 定义 了 一 个 描述 MID 块 设备 的 结 
Kj mtdblk_ dev， 并 声明 了 一 个 名 为 mtdblks 的 指针 数组 ， 这 数组 中 的 每 一 个 mtdblk_dev 
和 mtd. table 中 的 每 一 个 mtd. info 一 一 对 应 。 
e 设备 节点 : 通过 mknod 在 /dev 子 目录 下 建立 MTD 字符 设备 节点 〈 主 设备 号 为 90) 和 MTD 
块 设备 节点 〈 主 设备 号 为 31)， 用 户 通过 访问 此 设备 节点 即 可 访问 MTD 字符 设备 和 块 设备 。 


19.1.2. Linux MTD 系统 接口 


如 图 19.2 所 示 , 在 引入 MTD 后 ,底层 Flash 驱动 直接 与 MTD 原始 设备 层 交 互 ， 利 用 其 提供 
的 接口 注册 设备 和 分 区 。 
于 描述 MTD 原始 设备 的 数据 结构 是 mtd_info， 这 其 中 定义 了 大 量 关 于 MTD 的 数据 和 操作 
函数 ， 这 个 结构 体 的 定义 如 代码 清单 19.1 所 示 。mtd_info 是 表示 MTD 原始 设备 的 结构 体 ， 每 个 
分 区 也 被 认为 是 一 个 mtd_info， 例 如 ， 如 果 有 两 个 MTD 原始 设备 ， 而 每 个 上 有 3 个 分 区 ， 在 系 
统 中 就 将 共有 6 个 mtd info 结构 体 ， 这 些 mtd. info 的 指针 被 存放 在 名 为 mtd. table 的 数组 里 。 














19.1 Linux MTD 系统 
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00O 






mtd_notifier mtd_notifier 


MTD 设备 层 字符 设备 mtd_fops 块 设备 mtd_fops 
(mtdchar.c) (mtdblock.c) mtdblks 

















register mtd user () 
get mtd. device () 
unregister mtd user () 
put mtd. device () 


erase. info 


mtd. notifiers add mtd partitions () 


mtd table del. mtd. partitions () 


原始 设备 层 mtd_info add mtd. device () Your Flash 


(your-flash.c) 
mtd. part del. mtd. device Q íi 


(mtdcore.c) mtd. partition 





(mtdpart.c ) 


19.2 ”底层 Flash 驱动 


代码 清单 19.1 mtd info 结构 体 




































































JL EEIen diel tae 3| 

2 uchar type; /* 内 存 技术 的 类 型 */ 

3 u int32 t flags; /i 

4  uint32 t size; /*mtd 设备 的 大 小 */ 

5 u int32 t erasesize; /* 主 要 的 擦 除 块 大 小 */ 

6 uint32 t writesize;  /* 最 小 的 可 写 单元 的 字 节 数 */ 

7 u int32 t oobsize; /* OOB 7 AX / 

8 u int32 t oobavail; /* 可 用 的 00B 字 节 数 */ 

9 

0 char *name; 

1l int index; 

2 struct nand ecclayout *ecclayout; /*ECC 布局 结构 体 指针 */ 

B 

4 ”/* 不 同 的 erasesize 的 区 域 */ 

5 int numeraseregions; /* 不 同 erasesize 的 区 域 的 数目 (通常 是 1) */ 
6 struct mtd erase region info *eraseregions; 

p 

8 u int32 t bank size; 

9 struct module *module; 

20 anto*erase) (struct mtd info *mbd, sbruct.erase info *instk). 
2 

22  /* 针 对 eXecute-In-Place */ 

2 nent me lone e eon sn 
24 size t *retlen, void **virt, resource size t *phys); 

25) 

26  /* 如 果 unpoint 为 空 ， 不 允许 XIP */ 

2 vorei (Cohan) Ms ee wec iare eb ie» e roon. Size w Lem? 
28 

29  int(*read) (struct mtd info *mtd, loff t from, size t len, size t *retlen, 
30 u_char *buf); /* 读 Flash */ 
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Sm intiotwrite)istruct mtd nto "ud. loirt e tor Lize © Jen; sicer ecler, 
32 const u char *buf); /*5 Flash */ 

S3 mme en ee (Sceus wel sos "eu. lues e Tor 

34 size t len, size t *retlen, const u char *buf); /*Kernel panic H|AZEZE'5*/ 
350 me (verel cob (Stuer meel 1nfootubd. lori e 

36 from, struct mtd oob ops *ops); /*i€& out-of-band */ 

37 oe (*wrelte 009) (struck mtd nE 'mtd, lotf Lb to, 

38 struct mtd oob ops *ops); /*5jout-of-band */ 

39  /* iovec-based 读 写 函数 */ 

40 Iae Uuribpev) (Eerme mee inro mte- const seret kvec 

41 *vecs, unsigned long count, loff t to, size t *retlen); 
42 

ALS — (59 esae. v 

AMA. yode visio e) (Qe ome MEE aene) AN p 

45 

46  /* 设备 锁 */ 

41 ime (leeki struct reel de nite" lerr e Ots; Si28 © kenje 
48 ine ey (de eve mec hinto Amed lori e ofe; S128 © Lens 
49  /* 电源 管理 函数 */ 

50 int(*suspend) (struct mtd info *mtd); 

5T vord(*resume)(struct mkd into mtd) 

52 

53  /* 坏 块 管理 函数 */ 

54 ime aloe Se (scares mtd info te lorr t ee 

5a ime (gloez omnarktadj (met mec inco ttu. lori € GES)? 

56 Jas 

57 void *priv; /* 私 有 数据 */ 

58 

DIOS 





























mtd info 的 type 字段 给 出 底层 物理 设备 的 类 型 ， 包 括 MTD RAM. MTD ROM. MTD 
NORFLASH、MTD_NANDFLASH 等 。 
flags 字段 标志 可 以 是 MTD_WRITEABLE、MTD _BIT_WRITEABLE、MTD_NO_ERASE、 
MTD POWERUP LOCK 等 的 组 合 。 针 对 ROM rfj zi, 不 具有 上 述 任何 属性 , 因此 MTD CAP ROM 
定义 为 0; MTD CAP RAM 是 MTD_WRITEABLE、MTD_BIT_WRITEABLE、MTD_NO_ERASE 
的 组 合 ; MTD CAP NORFLASH 是 MTD_WRITEABLE、MTD_BIT_WRITEABLE 的 组 合 ， 而 对 
MTD CAP NANDFLASH 则 仅 意 味 着 MTD WRITEABLE. 

mtd info 中 的 read0、writeO0、read_oob0、write oob0、erase0 是 MTD 设备 驱动 要 实现 的 3 
要 函数 ， 后 面 我 们 将 看 到 ， 在 NOR 和 NAND 的 驱动 代码 中 几乎 看 不 到 mtd. info 的 成 员 函 数 〈 
即 这 些 成 员 函 数 对 于 Flash 芯片 驱动 是 透明 的 )， 这 是 因为 Linux 在 MTD 的 下 层 实现 了 针对 NOR 
Flash 和 NAND Flash 的 通用 的 mtd_info 成 员 函 数 。 

某 些 内 存 技术 支持 带 外 数据 (OOB )， 例 如 ，NAND Flash 每 512 字 节 就 会 有 16 个 字 节 的 “ 额 
外 数据 ”用 于 存放 纠 错 码 或 文件 系统 元 数据 。 这 是 因为 ， 所 有 Flash 器 件 都 受 “ 位 翻转 ”现象 的 
困扰 ， 而 NAND 发 生 的 概率 比 NOR 大 ， 因 此 NAND 厂商 推荐 在 使 用 NAND 的 时 候 最 好 要 使 用 
ECC (Error Checking and Correcting)， 汉 明码 是 最 简单 的 ECC。mtd_info 的 ecclayout 类 型 即 是 描 
述 OOB 区 域 中 ECC 字 节 的 布局 情况 。 

Flash 驱动 中 使 用 如 下 两 个 函数 注册 和 注销 MTD 设备 : 


int add mtd device(struct mtd info *mtd); 
































PT 
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int del mtd device (struct mtd info *mtd); 
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代码 清单 19.2 所 示 的 mtd_part 结构 体 用 于 表示 分 区 ， 其 mtd info 结构 体 成 员 用 于 描述 该 分 区 ， 
它 会 被 加 入 到 mtd table (定义 为 struct mtd. info *mtd_table[MAX _ MTD DEVICESDp 中 ， 其 大 部 分 成 
员 由 其 主 分 区 mtd. part master 决定 ， 各 种 函数 也 指向 主 分 区 的 相应 函数 。 


代码 清单 19.2 mtd_part 结构 体 














00O 
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JL StErUCE MEA pArE nt 

2 struct mtd info mtd; /* 分 区 的 信息 (大 部 分 由 其 master 决定 ) */ 
3 struct mtd info *master; /* 该 分 区 的 主 分 区 */ 

4 u int32 t offset; /* 该 分 区 的 偏 移 地 址 */ 

5 int index; /*4[X5*/ 
6 
7 
8 


















































struct Litst head e Si 
int registered; 
un 
mtd partition 会 在 MTD 原始 设备 层 调用 add_mtd_partions0 时 传递 分 区 信息 用 ， 这 个 结构 体 


的 定义 如 代码 清单 19.3 所 示 。 


代码 清单 19.3 mtd partition 结构 体 






















































































ee een Mor ic 

2 char *name; /* 标识 字符 串 */ 

3o nee gize; 7 a RAN 
A EE /* 主 MTD 空间 内 的 偏 移 */ 
5 u.int32 t mask flags; /* 掩 码 标志 */ 

6 struct nand ecclayout *ecclayout; /* OOB 布局 */ 
$i erruet moe daro venero P 

S DE 























Flash 驱动 中 使 用 如 下 两 个 函数 注册 和 注销 分 区 : 


int add mtd partitions (struct mtd info *master, struct mtd partition *parts, int nbparts); 
































int del mtd partitions(struct mtd info "master); 

add_mtd_partitionsO 会 对 每 一 个 新 建 分 区 建立 一 个 新 的 mtd. part 结构 体 , 将 其 加 入 mtd. partitions 
中 ， 并 调用 add_mtd_device() 将 此 分 区 作为 MTD 设备 加 入 mtd table。 成 功 时 返回 0， 如 果 分 配 
mtd part 时 内 存 不 足 ， 则 返回 -ENOMEM。 

del_mtd_partitionsO 的 作用 是 对 于 mtd partitions 上 的 每 一 个 分 区 ， 如 果 它 的 主 分 区 是 master 
(参数 master 是 被 删除 分 区 的 主 分 区 )， 则 将 它 从 mtd. partitions 和 mtd. table 中 删除 并 释放 掉 ， 这 
个 函数 会 调用 del_mtd_device()。 

add_mtd_partitions() 中 新 建 的 mtd part 需要 依赖 传 入 的 mtd. partition 参数 对 其 进行 初始 化 ， 如 
代码 清单 19.4 所 示 。 
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代码 清单 19.4 add mtd partitions() E 


int add mtd partitions(struct mtd info *master, 





2 const struct mtd partition *parts, 

3 int nbparts) 

4 oq 

5 struct mtd part *slave; 

6 Qi abono nn onis. 0 

7 te 

8 

9 printk(KERN NOTICE "Creating $d MTD partitions on \"%s\":\n", nbparts, master name); 
10 
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Jb dens (un e QE Sdn X€ ideloyXeustoeu. dbss3s) 

2 Slave - add one partition (master, parts -* i, i, cur offset); 
3 if (!slave) 

4 return -ENOMEM; 

5 cur offset = slaveooffset + slaveomtd.size; 

G 

4i 

8 return 0; 

9 Jj 
20 
2L Ve Ede lo Cele eol oe lO me oe ne en eo tne maS EET 
22 eonmst es tn medipartit Ioni ne 
2/5 |i abiens qe. tenbhe (ub fet 
ZA 
25. te meel oant Slaves 
26 


27  /* allocate the partition structure */ 
28 slave - kzalloc(sizeof(*slave), GFP KERNEL); 


30 list add(&slaveolist, &mtd partitions); 


32  /* 设置 分 区 的 MTD 对 象 */ 

33  slave.mtd.type = master.type; 

34  slave.mtd.flags = master.flags & ~part ,mask flags; 
35  slave.mtd.size = part.size; 

36 slave.mtd.writesize = master.writesize; 

37  slave.mtd.oobsize = master.oobsize; 

38  slave.mtd.oobavail = master-oobavail; 

39  slave.mtd.subpage sft = master.subpage sft; 


41  slave.mtd.name = part.name; 
42  slave.mtd.owner = master ,owner; 


44  slaveemtd.read = part read; 
45  slaveemtd.write = part write; 


46 

47 

48 

49 if (slaveooffset == MTDPART OFS APPEND) 

50 slave>offset = cur offset; 

Si if (slaveooffset == MTDPART OFS NXTBLK) { 

52 Slaveooffset = cur offset; 

S if ((cur offset $ masteroerasesize) !- 0) { 

54 sSlaveooffset- ((cur offset / masterserasesize) -— 1) * masterserasesize; 
55 printk(KERN NOTICE "Moving partition $d: " 
56 "Oze08x - Oxv08xVin'", partso, 

57 cur offset, slaveooffset); 

58 } 

9S9 ] 

60 if (slaveomtd.size == MTDPART SIZ FULL) 

61 Slaveomtd.size = masterosize - slave ,offset; 
62 

63 

64 


GS AA BEMPANES. v7 
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eoo 


66 add mtd device (&slave-mtd) ; 





67 

68 return slave; 

GS 

最 后 , 为 了 使 系统 能 支持 MTD 字符 设备 与 块 设备 及 MTD 分 区 , 在 编译 内 核 时 应 该 包括 相应 





























的 配置 选项 ， 如 下 所 示 。 


Memory Technology Devices (MTD)--— 




















«*» Memory Technology Device (MTD) support 
p*7 MTD partitioning support 


--- User Modules And Translation Layers 
«*» Direct char device access to MTD devices 
«*» Caching block device access to MTD devices 


19.1.3 MTD 用 户 空间 编程 

drivers/mtd/mtdchar.c 文件 实现 了 MTD 字符 设备 接口 ， 通 过 它 ， 用 户 可 以 直接 操作 Flash 设备 。 
通过 read()、write() 系 统 调用 可 以 读 写 Flash， 通 过 一 系列 IOCTL 命令 可 以 获取 Flash 设备 信息 、 
擦 除 Flassh、 读 写 NAND 的 OOB、 获 取 OOB layout 及 检查 NAND 坏 块 等 。 

代码 清单 19.5 所 示 为 MEMGETINFO、MEMERASE、MEMREADOOB、MEMWRITEOOB、 
MEMGETBADBLOCK IOCRL 的 例子 。 
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代码 清单 19.5 /dev/mtdX IOCTL 演示 范例 
mtd oob buf oob; 


erase info user erase; 
mtd info user meminfo; 


/* 得 到 MTD 设备 信息 */ 
if (ioctl(fd, MEMGETINFO, &meminfo) != 0) 
perror ("ioctl(MEMGETINFO)"); 


Ao "Ox I Oi UT 4$ O0 ES 


/* 擦 除 块 */ 

if (ioctl(ofd, MEMERASE, &erase) !- 0) { 
perror("ioctl(MEMERASE)"); 
goto error; 


} 


GE 
if (ioctl(fd, MEMREADOOB, &oob) != 0) 
perror ("ioctl (MEMREADOOB)"); 





9j JERO 5) 

20 if (ioctl(fd, MEMWRITEOOB, &oob) !- 0) ( 

21 fprintf(stderr, "WMn$s: $s: MTD writeoob failure: $sMXn", exe name, mtd device, 
22 strerror (errno)); 

29 


25 /* 检 查 坏 块 */ 

26 if (blockstart !- (ofs &(-«meminfo.erasesize t 1))) ( 

2) blockstart = ofs &(-«meminfo.erasesize + 1); 

28 if ((badblock = ioctl(fd, MEMGETBADBLOCK, &blockstart)) < 0) 
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29 perror("ioctl(MEMGETBADBLOCK) "); 
30 else if (badblock) {/* 是 坏 块 */ 
3L e 
32 } else/# 是 好 块 */ 
33 uo 
34 ] 
尺码 清单 19.6 所 示 的 过 程 如 下 : 它 读 取 记 录 在 一 个 映像 文件 中 的 针对 NAND 的 数据 信息 ， 
并 把 它 写 到 NAND Flash 中 。 代 码 中 涉及 大 量 IOCTL 的 调用 及 NAND 的 擦 除 和 写 入 过 程 ( 含 坏 
块 检查 )，mtd-utils 中 nand write. flash eraseall 等 工具 也 是 借助 类 似 方法 实现 的 。 
代码 清单 19.6 /dev/mtdX 用 户 空 间 编程 综合 范例 
int main(int argc, char **argv) 
2 { 
3 struct mtd info user meminfo; 
4 struct meo o0- Dui oo 
5 char oobbuf [MAX OOB SIZE]; 
6 
Y: 
8 memset(oobbuf, Oxff, sizeof(oobbuf)); 
9 
0 /* d[Jf/dev/mtdX */ 
1l if ((fd = open(mtd device, O RDWR)) == - 1) ( 
2 perror("open Flash"); 
2 exit (1); 
4 } 
5 
6 ”/* 填充 MTD 设备 容量 结构 体 */ 
3 if (ioctl(fd, MEMGETINFO, &meminfo) !- 0) ( 
8 perror ("MEMGETINFO"); 
9 close (fd); 
20 exit(1); 
21 ) 
22 
23 oob.length = meminfo.oobsize; 
24 oob.ptr = oobbuf; 
2:5 
26 A RA E f 
28 if ((ifd -» open(img, O RDONLY)) -- - 1) ( 
28 perror("open input file"); 
209 goto restoreoob; 
30 } 
31 
32 
33 imglen = lseek(ifd, 0, SEEK END);  /* 得 到 映像 长 度 */ 
34 JLsxexeXie (ael, (0 SERER SETIS 
35 
36 pagelen = meminfo.oobblock + meminfo.oobsize; /* 一 页 的 (数据 +oob) 长 度 */ 
sH 
38 
39 /* 从 输入 文件 读数 据 然 后 写 入 MTD 设备 */ 
40 while (imglen && (mtdoffset < meminfo.size)) { 
41 /* 在 擦 除 块 之 前 检查 是 否 为 坏 块 */ 
42 while (blockstart != (mtdoffset &(~meminfo.erasesize + 1))) { 
486 IINUX, 
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© 
Q 

43 blockstart = mtdoffset &(-«meminfo.erasesize + 1); ® 

44 offs - blockstart; 

45 baderaseblock = 0; 

46 if (!quiet) 

47 forinttistdout, "Writing data to block $xin", blockstartj: 

48 

49 /* 检查 坏 块 */ 

50 CET 

Sj if ((ret = ioctl(fd, MEMGETBADBLOCK, &offs)) « O) f 

52 perror ("ioctl (MEMGETBADBLOCK)"); 

33 goto closeall; 

54 ) 

55 if (ret == 1) { 

56 baderaseblock - 1; 

D if (!quiet) 

58 fprintf (stderr, 

59 "Bad block at $x, $u block(s) from $x will be skippedWn", 

60 (int)offs, blockalign, blockstart); 

61 } 

62 if (baderaseblock) { 

63 mtdoffset = blockstart + meminfo.erasesize; 

64 } 

65 offs += meminfo.erasesize / blockalign; 

66 ) while (offs < blockstart + meminfo.erasesize); 

67 ) 

68 

69 readlen = meminfo.oobblock; 

70 

71 /* 从 输入 文件 中 读 page 数据 */ 

n if ((cnt = read(ifd, writebuf, readlen)) !- readlen) ( 

y if (cnt -- 0) JE atom ie 

74 break; 

135) perror("File I/O error on input file"); 

T8 goto closeall; 

Al ) 

78 

79 /* 从 输入 文件 读 ooB 数据 */ 

80 if ((cnt = read(ifd, oobreadbuf, meminfo.oobsize)) != meminfo.oobsize) { 

81 perror("File I/O error on input file"); 

82 goto closeall; 

83 } 

84 

85 /* 将 ooB 数据 写 入 设备 */ 

86 oob.start = mtdoffset; 

87 if (ioctl(fd, MEMWRITEOOB, &oob) !- 0) ( 

88 perror ("ioctl (MEMWRITEOOB)"); 

89 goto closeall; 

90 } 

91 

p» /* 5j page Zi */ 

93 if (pwrite(fd, writebuf, meminfo.oobblock, mtdoffset) !- meminfo.oobblock) { 

94 perror("pwrite"); 

3 goto closeall; 

96 } 

go imglen -= readlen; 
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98 mtdoffset += meminfo.oobblock; 


101 closeall: 
102 return 0; 
DOSE 


Í 2 NOR Flash 驱动 














fr Linux 系统 中 ， 实 现 了 针对 CFI (公共 Flash 接口 )、 
JEDEC (电子 元 件 工业 联合 会 ) 等 接口 的 通用 NOR 驱动 ， 这 
层 的 驱动 直接 面向 mtd info 的 成 员 函 数 , 这 使 得 NOR 的 芯 0 ------L----- mtd_info 
片 级 驱动 变 得 十 分 简单 ， 只 需要 定义 具体 的 内 存 映 射 情况 结构 


























































































































































CFI, JEDEC 等 NOR 

























































































体 map info 并 使 用 指定 接口 类 型 调用 do_map_ probe()。 Flash 通用 驱动 

NOR Flash 驱动 的 核心 是 定义 map. info 结构 体 ， 它 指定 —————map_info 
了 NOR Flash 的 基 址 、 位 宽 、 大 小 等 信息 以 及 Flash 的 读 写 UL TEBDECHEROR 
函数 ， 该 结构 体 对 于 NOR Flash 驱动 而 言 非常 关键 ， 甚 至 Flash 底层 驱动 
NOR Flash 驱动 的 代码 本 质 上 可 以 被 认 作 是 根据 map. info 探 19.3 MTD, ÑA NOR Flash 
测 蕊 片 的 过 程 ， 其 定义 如 代码 清单 19.7 所 示 。 驱动 与 map_info 
































代码 清单 19.7 ”map info 结构 体 
OSI 
2 char *name; 
3 unsigned long size; 
4 unsigned long phys; 
b ddefine NO XIP (-1UL) 
6 
vi 
8 
9 


void _iomem *virt; /* 虚拟 地 址 */ 


void *cached; 





0 int bankwidth; /* 总 线 宽度 */ 
ai 
2 #ifdef CONFIG_MTD_COMPLEX_MAPPINGS 
3 map word(*read) (struct map info *, unsigned long); 
4 void(*copy from) (struct map info *, void *, unsigned long, ssize t); 
5 
6 void(*write) (struct map info *, const map word, unsigned long); 
J void(*copy to) (struct map info *, unsigned long, const void *, ssize t); 
8 #endif 
9 /* 缓存 的 虚拟 地 址 */ 
20  void(*inval cache) (struct map info *, unsigned long, ssize t); 
2 
22  void(*set vpp) (struct map info *, int); 
23 
24 unsigned long map priv 1; 
25 unsigned long map priv 2; 
2$. TOLC Srle Teac avr 
Zu struct mtd chip driver *fldrv; 
ZONES 
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NOR Flash 驱动 在 Linux ! 











初始 化 map_info 
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如 图 19.4 所 示 ， 主 要 的 工作 如 下 。 

















Į 










do map. probe() 4921] 
mtd info 











19.4 NOR 














(1) 定义 map info 的 实例 ， 初 始 化 其 
和 phys 赋值 。 
(2) 如 果 Flash 要 分 区 








则 定义 mtd partition 数 





C3) 以 map info 和 探测 的 接口 类 型 (如 "cfi probe". "jedec probe" 55) 为 参数 调 | 


探测 Flash 得 到 mtd info. 
do_map_probe() 的 函数 原型 为 : 








Flash 驱动 








的 成 员 ， 根据 目标 板 的 情况 为 name、size、bankwidth 


























组 ， 将 实际 电路 板 中 Flash 分 区 信息 记录 于 其 中 。 


























J do map probe(), 


struct mtd info *do map probe (const char *name, struct map info *map); 














第 一 个 参数 为 探测 的 接口 类 型 ， 常 见 的 调 / 
do map probe ("cfi probe",&xxx map info); 
do map probe ("jedec probe",&xxx map info); 
do map probe ("map rom",&xxx map info); 
































方法 如 下 。 





do_map_probeO 会 根据 传 入 的 参数 name 通过 get_mtd_chip_driver() 得 到 具体 的 MTD 驱动 , 调 


























用 与 接口 对 应 的 probe0 函 数 探测 设备 ， 如 代码 清和 





É 19.8 所 示 。 





代码 清单 19.8 do_map_probe() 函 数 














struct mtd info *do map probe(const char *name, struct map info *map) 


1L 

2 

3 struct mtd chip driver *drv; 

4 struct mtd info *ret; 

9 

6 drv = get mtd chip driver (name); /* 通过 名 称 获得 驱动 */ 
3 

8 if (!drv && !request module ("$s", name)) 
9 drv = get mtd chip driver (name); 

10 

3L abs. OES) 

32 return NULL; 

13 
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ret = drv—probe (map); /* 调用 驱动 的 探测 函数 */ 


if (ret) 


4 

5 

6  module.put (drvomodule); 
7l 

8 return ret; 


20 return NULL; 


























利用 map info 中 的 配置 ,do_map_probeO 可 以 自动 识别 支持 CFI £X JEDEC 接口 的 Flash 心 片 ， 
MTD 以 后 会 自动 采用 适当 的 命令 参数 对 Flash 进行 读 写 或 擦 除 。 

(4) 在 模块 初始 化 时 以 mtd info 为 参数 调用 add_mtd_device0 或 以 mtd info. mtd partition 数组 及 
分 区 数 为 参数 调用 add_mtd_partitions() 注 册 设 备 或 分 区 。 当 然 ， 在 这 之 前 可 以 调用 parse. mtd. partitions() 
查看 Flash 上 是 否 已 有 分 区 信息 ， 并 将 查看 出 的 分 区 信息 通过 add mtd partitions. 

(5) 在 模块 卸载 时 调用 第 4 行 函数 的 “ 反 函 数 ” 删 除 设 备 或 分 区 。 

代码 清单 19.9 所 示 为 一 个 最 简单 的 NOR Flash 驱动 模板 。 
代码 清单 19.9 NOR Flash 设备 驱动 模板 









































































































































































































































1 #define WINDOW_SIZE ... 
2 #define WINDOW ADDR ... 
3 static struct map .info xxx map - ( /*map.info */ 
4 sname - "xxx Flash", 
E .Size = WINDOW SIZE, /*X/h*/ 
6 .bankwidth = 1, /+* 总 线 宽度 */ 
7 .phys = WINDOW ADDR /* 物 理 地 址 */ 
9 kg 
9 
0 static struct mtd partition xxx partitions[] - ( /* mtd partition */ 
T MET 
2 .name = "Drive A", 
3 .offset = 0, /* 分 区 的 偏 移 地 址 */ 
4 .Size = 0x0e0000 /V* 分 区 大 小 */ 
ET 
(c 
"o 
8 
9 #define NUM PARTITIONS ARRAY SIZE(xxx partitions) 
20 
2L sese SELCE eol assume. ie 
22 
2.5| Srece amc ake Lio ee xe umego (utet) 
24 ( 
25b. mb ro =O; 
26 
27 xxx map.virt-ioremap nocache (xxx map.phys, xxx mapb.size);/* 物 理 一 虚拟 地 址 */ 
28 
29 sue (ooe Mve le vonage) d 
30 printk(KERN ERR "Failed to ioremap nocache Wn"); 
31 Le 
32 goto err2; 
SIS 
34 
35 simple map init(&xxx map); 
36 
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37 mymtd = do map probe("jedec probe", &xxx map) ; /# 探 测 nor Flash */ 
Sis att (bano) A 

39 rc = -ENXIO; 

40 goto errl; 

} 


@O@ 


mymtdoowner = THIS MODULE; 
add mtd partitions (mymtd, xxx partitions, NUM PARTITIONS);/* 添 加 分 区 信息 */ 


return 0; 
errl: 


map destroy (mymtd); 
50  iounmap (xxx map.virt); 





SAEST 2: 

52 return ro} 

33 y 

54 

55 static void . exit cleanup xxx map (void) 
S. d 

S x3 (onsaque) 1 

58 del mtd partitions (mymtd);/*M 4 X */ 
D8 map.destroy (mymtd); 

60 } 

61 

62 (na 

63 iounmap (xxx map.virt); 

64 xxx map.virt - NULL; 

G5 

66 jJ 


Í 9.3 NAND Flash 驱动 


和 NOR Flash 非常 类 似 ， 如 图 19.5 所 示 ，Linux 内 核 在 MTD 
的 下 层 实现 了 通用 的 NAND 驱动 (主要 通过 drivers/mtd/nand/ 




























































































nand base.c 文件 实现 )， 因 此 芯片 级 的 NAND 驱动 不 再 需要 实现 ------T----- mtd info 
mtd info 中 的 read(). write(). read oob(). write oob() 55: X 5a AXO nand core, 主要 
而 主体 转移 到 了 nand. chip 数据 结构 。 T basere 




















MTD 使 用 nand chip 数据 结构 表示 一 个 NAND Flash iS), |^ ------L---- 一 nand_chip 


这 个 结构 体 中 包含 了 关于 NAND Flash 的 地 址 信息 、 读 写 方法 、 VAT 
ECC 模式 、 硬 件 控制 等 一 系列 底层 机 制 , 其 定义 如 代码 清单 19.10 


所 示 。 19.5 NAND Flash 驱动 


代码 清单 19.10 nand chip 结构 体 





































































































US eam el 

2 void _ iomem *IO ADDR R; /* 读 8 位 I/O 线 的 地 址 ， 由 板 决 定 */ 
3 void _ iomem *IO ADDR W; /* 写 8 位 I/0 线 的 地 址 ， 由 板 决定 */ 
4 
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5 uints t (*read byte) (struct mtd info *mtd); 

6 ul6 [tread word)»istruct mbücinfo *mrtadys 

T void (write bwt)isbruct mtd. unto *mtd. const uwinto b *bor, isE Len) 

8 void (*read but)tstruat mtd info mtd. urnkS t *buf, imt lem); 

9 "grt (Cave ranny loxuE) (ec oe mee aare eC Nore umes (t giup duoc leny 

0 void (*select chip) (struct mtd info *mtd, int chip); /* Xe */ 

i ine (*block bad) (struct mtd info *mtd, loff_t ofs, int getchip); /* 是 否 坏 块 */ 

2. dim (*block markbad) (struct mtd info *mtd, loff t ofs); /* 标记 坏 块 */ 

do voël (temdoctrpl)tsbruct mid 19fo- fmbud, iet dat, 

4 unsigned int ctrl); /* 控制 ALE/CLE/nCE， 也 用 于 写 命令 和 地 址 */ 

Ga NE (*dev ready) (struct mtd info *mtd); /* 设备 就 绪 */ 

B vod (*cmdfunc) (struct mtd info *mtd, unsigned command, int column, int page addr); 

d esed (*waitfunc) (struct mtd info *mtd, struct nand chip *this); 

Be yore (*erase cmd) (struct mtd info *mtd, int page); 

Sh qe ("scan gt) istruct mtd info *mbgj) 

20 int (*errstat) (struct mtd info *mtd, struct nand chip *this, int state, int status, int page); 

S1 cab (*write page) (struct mtd info *mtd, struct nand chip *chip, 

22 const uint8 t *buf, int page, int cached, int raw); 

29) 

24 int chip delay; 

zb. wnelgned Int options: 

26 

ze gr page shift; 

28 aliae phys erase shift; 

29 abaie: bbt erase shift; 

30 aba (on Cei tes 

31 aigue: numchips; 

32 unsigned longchipsize; 

SOC pagemask; 

S4 cnt pagebuf; 

Its subpagesize; 

S8. sebo E cêllinfo; 

S amp badblockpos; 

38 

39  nand state t state; 

40 

AdL niue E *oob poi; 

aZ cstrnet mene mo comtrot eontrel lers 

43 struct nand ecclayout *ecclayout; 

44 

45 Stsructoenandaeccecbaal ecc 

Ag ebtruct nene burtters "buffers; 

47 Struct nand Ne control WC OD 077 

48 

49 Struct mtd oob ops ops; 

50 

Dl mimeo t AEE 

52 ee mand nbc descr "bt tg: 

53- oStrüct nand bbt deser tea 

54 

55 struct nand bbt descr *badblock pattern; 

56 

SU VOIL ROAN 

581s; 

5j NOR Flash 类 似 ， 由 于 有 了 MTD 层 ， 完 成 一 个 NAND Flash 驱动 在 Linux 中 的 工作 量 
也 很 小 ， 如 图 19.6 所 示 ， 主 要 的 工作 如 下 。 
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oo06 









模块 加 载 


初始 化 mtd_info， 其 priv 指 向 下 面 的 
nand_chip 








初始 化 nand_chip 中 的 hwcontrolO、 
dev readyO. chip delay). ecemode^ 





v 


初始 化 NAND Flash VO 接口 状态 | 








v 


can() | 





nand s 










add mtd device()/add mtd partitions() 











nand release() 








模块 印 载 


人 


19.6 NAND Flash 驱动 























(1) 如 果 Flash 要 分 区 , 则 定义 mtd. partition 数组 , 将 实际 电路 板 中 Flash 分 区 信息 记录 于 其 中 。 

(20 在 模块 加 载 时 分 配 和 nand chip 的 内 存 ， 根 据 目标 板 NAND 控制 器 的 情况 初始 化 
nand chip 中 的 cmd_ctrl ().dev ready().read byte().read buf().write buf().select chip().block bad(). 
block_markbad() 等 成 员 函 数 〈( 如 果 不 赋值 会 使 用 nand base.c 中 的 默认 函数 ， 这 里 典型 利用 了 面向 对 
象 的 继承 和 重 载 的 思想 )， 注 意 将 mtd info 的 priv 置 为 nand_chip。 

(3) 以 mtd. info 为 参数 调用 nand_scan0 函 数 探 测 NAND Flash 的 存在 .nand_scan0 函 数 的 原型 为 : 

int nand scan (struct mtd info *mtd, int maxchips); 

nand scan) KAAR NAND 芯片 ID , 并 根据 mtd— priv 即 nand. chip 中 的 成 员 初 始 化 mtd. info. 

(4) 如 果 要 分 区 ， 则 以 mtd info 和 mtd partition 为 参数 调用 add_mtd_partitions0， 添 加 分 区 信息 。 

代码 清单 19.11 所 示 为 一 个 简单 的 NAND Flash 设备 驱动 模板 。 


代码 清单 19.11 NAND Flash 设备 驱动 模板 









































































































































































































































1 #define CHIP PHYSICAL ADDRESS 

2 s4define NUM PARTITIONS 2 

S) taero ce no lc emo er tie 5 d 

4 { 

5 .name - "Flash partition 1", .offset - 0, .size - 8 * 1024 * 1024 
6 ), 

] { 

8 -name —- "Flash partition 2", .offset - MTDPART OFS NEXT, .size - 
9 MTDPART SIZ FULL 

10 jur 

11 y; 

T2- Tt — Init board init (yord) 

ont 

14 Struct mand (eleatjs) foret ere 

15- (Xn scr e qe 

16 /* 为 MTD 设备 结构 体 和 nand chip 分 配 内 存 */ 
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69 
70 
ql 
72 
7/8) 


board mtd - kmalloc(sizeof(struct mtd info) -* sizeof(struct nand chip), 
GFP KERNEL); 
if (!board mtd) ( 
printk("Unable to allocate NAND MTD device structure. Mn"); 
err = - ENOMEM; 
goto out; 


] 
/* 初始 化 结构 体 */ 
memset((char*)board mtd, 0, sizeof(struct mtd info) * sizeof(struct nand chip)); 
/* 映射 物理 地 址 */ 
baseaddr = (unsigned long)ioremap (CHIP PHYSICAL ADDRESS, 1024); 
Af €Pbaseaddr) 1 
printk("Ioremap to access NAND chip failedMn"); 
err = BURG 
goto out_mtd; 
} 
/* 获得 私有 数据 (and chip) 指针 */ 
this - (struct nand chip*) (&board mtd[1]); 
/* Xf nand chip 赋予 mtd_info 私有 指针 */ 
board mtd-priv - this; 
/* 设置 NAND Flash 的 I/0 基地 址 */ 
this IO ADDR R = baseaddr; 
this IO ADDR W = baseaddr; 
/* 硬件 控制 函数 */ 
thisocmd ctrl = board hwcontrol; 
/* 初始 化 设备 ready 函数 */ 
this-dev ready = board dev ready; 
/* 扫描 以 确定 设备 的 存在 */ 
if (nand scan(board mtd, 1)) ( 
err = - ENXIO; 
COTO Gut ak pie 2 




















} 

/* 添加 分 区 */ 

add mtd partitions (board mtd, partition info, NUM PARTITIONS); 
ooto Ot 

out ior: iounmap ((void*)baseaddr); 

out mtd: kfree (board mtd); 

out: return err; 


Static void | exit board cleanup(void) 
( 

/* 释放 资源 ， 注 销 设备 */ 

nand release (board mtd); 

/* unmap 物理 地 址 */ 

iounmap ((void*)baseaddr); 

/* 释放 MTD 设备 结构 体 */ 

kfree (board mtd); 





/* 硬件 控制 */ 
static void board hwcontrol(struct mtd info *mtd, int dat, unsigned int ctrl) 
{ 


if (ctrl & NAND CTRL CHANGE) ( 
if (ctrl & NAND NCE) { 
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© 
Q 

74 } 

3/8 © 

76 /* 返回 设备 ready 状态 * 

7' static int board dev ready(struct mtd info *mtd) 

O 

79 return xxx read ready bit(); 

80 ] 

最 后 要 强调 的 是 , 在 NAND 芯片 级 驱动 中 , 如 果 在 nand chip 中 没有 赋值 , 将 使 用 如 代码 清单 19.12 
所 示 的 默认 分 布 。 因 此 ， 若 不 使 用 默认 分 布 ,在 NAND 驱动 中 ， 应 该 根据 实际 NAND 控制 器 和 NAND 
芯片 的 情况 给 nand_chip 的 nand_ecc_ctrl 结构 体 类 型 成 员 ecc 赋值 ， 定 义 OOB 的 分 布 和 模式 。 

代码 清单 19.12 NAND 驱动 默认 的 OOB 分 布 
/* 页 大 小 为 256、512、2K、4K 字 节 情况 下 默认 的 Ecc 布局 */ 

2 

3 static struct nand ecclayout nand oob 8 - ( 

4 .eccbytes = 3, 

E "ocoposs S I) EIE? 

6 .oobfree = ( 

jq (.offset = 3, 

8 .length - 2], 

9 (.offset = 6, 

0 .length = 2}} 

JL. yg 

2 

3 static struct nand ecclayout nand oob 16 - ( 
4 .eccbytes = 6, 

Seo ecrUP ICE. S S TP 

6 .oobfree = { 

7 I OFSet eB 

8 length = 8}} 

o 

20 

21 static struct nand ecclayout nand oob 64 - ( 

22 .eccbytes - 24, 

23) .eccpos = { 

24 AQ. i. 4p. 4e. ^. AS. A. AT. 

25 Asp. Ona Cae. "obo. aye. ES oe o 

26 Xp S Xe 9r. (UL. Gib. (Au. (ei 

28 .oobfree = ( 

28 (.offset = 2, 

29 .length = 38}} 

30 pe 

31 

32 static struct nand ecclayout nand oob 128 - ( 

33 .eccbytes = 104, 

34 .eccpos = ( 

39 ZA. Zo. Z6 a Su 9 ep ey 

36 Sr e. S, Sip Sp GU S Sy 

37 Ay. d. Ae. die. ups Mp. HN. aF 

38 zs. ep. S40 ibo YA. 13e. iA. Dysy, 

39 B9, 9S3. 58. 99. GO. On. G2. (G3 

40 Ga ea a GG 

41 qUES. qe wn. Ws. Shu Wü dep 95 

42 GOPMECIMECIO MEC o ME OU MET 0 CE 

43 See SS O S O203 /0 

44 955 Sm. 9 r 1005. i101, 102. 1092 
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45 Juge. 05. 3G, 07. 0S9. i09. I9. dbi. 

46 id2, dis, dA. iiS, 116, duy. e, Tu. 

47 i20, i21, i122. 129, 124, 325, 126, 1271. 

48 .oobfree = { 

49 {.offset = 2, 

50 .length = 227} 

S e 

上 述 代 码 中 的 eccpos 表明 ECC 校 验 码 在 OOB 区 域 的 存放 位 置 ，eccbytes 是 校 验 码 的 长 度 ， 






































oobfree 则 是 除了 校 验 码 之 外 可 用 的 OOB 字 节 。 

nand ecc ctrl 结构 体 的 mode 字段 定义 ECC 的 放置 模式 , 包括 MTD_NANDECC_OFF (不 使 
] ECC), NAND ECC SOFT (使 用 软件 ECC)、NAND ECC HW (使 用 硬件 ECCO 等 。 如 果 
NAND 控制 器 支持 通过 硬件 进行 ECC 校 验 ， 则 最 好 使 用 NAND_ECC HW. 
内 核 中 包含 了 一 个 NAND 模拟 器 nandsim， 使 用 一 片 内 存 区 域 模拟 NAND， 在 没有 电路 板 的 
情况 下 ， 可 以 使 用 nandsim 模拟 NAND 芯片 。YAFFS 和 YAFFS2 中 分 别 包含 了 nandemul 和 
nandemul2k〔 用 于 模拟 页 大 小 为 2KB 的 NAND)， 也 可 以 模拟 NAND。 














































































































































































































Í 9,4 NOR Flash 驱动 实例 :S3C6410 外 围 的 NOR Flash 驱动 


针对 S3C2410、S3C6410 等 平台 而 言 ， 外 接 NOR Flash 的 情况 下 ， 由 于 该 NOR Flash 直接 
映射 在 CPU 的 内 存 空间 上 ,因此 可 以 直接 使 用 通用 的 drivers/mtd/maps/physmap.c 驱动 , 在 内 核 
配置 的 时 候 应 该 使 能 MTD_PHYSMAP。 为 了 使 用 NOR Flash， 我 们 只 需要 在 BSP 的 板 文件 中 
添加 相应 的 信息 ， 如 NOR Flash 所 在 的 物理 地 址 和 大 小 、 分 区 信息 、 总 线 宽度 等 ， 这 些 信息 以 
platform 资源 和 数据 的 形式 呈现 ， 如 代码 清单 19.13。 



















































































































































































代码 清单 19.13 S3C6410 外 围 NOR Flash 的 platform 数据 





1 static struct resource ldd6410 nor resource = { 
2 .Start = LDD6410 NOR BASE, 
3 .end = LDD6410 NOR BASE + 0x200000 - 1, 
4 .flags = IORESOURCE MEM, 
9. Ng 
6 
7 static struct mtd partition 1dd6410 mtd partitions[] -» ( 
8 { 
2 .name = "System", 
0 .Size = 0x40000, 
3l .offset = 0, 
2 .mask_flags = MTD_WRITEABLE, /* force read-only */ 
3 bz a 
4 .name zx Da 
5 .Size = 0x1C0000, 
6 .offset = MTDPART OFS APPEND, 
y ), 
SE 
9 
20 static struct physmap flash data ldd6410 flash data - ( 
21 .width -2, 
22 .parts = l1dd6410 mtd partitions, 
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24 }; 
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Te les = ARRAY SIZE(1dd6410 mtd partitions), 


26 static struct platform device ldd6410 device nor = { 


34 Y; 





上 述 代码 第 


ri 
IJ 





.name = "physmap-flash", 
VE = 0, 


.platform data - &ldd6410 flash data, 
im 


.num resources = 1, 
.resource = &ldd6410 nor resource, 


27 行 指 定 platform 设备 的 名 称 为 "physmap-flash”, 这 和 对 应 platform 驱动 drivers/ 





mtd/maps/physmap.c 中 定义 的 名 称 是 一 致 的 。 


1 9. 5 NAND Flash 驱动 实例 : S3C6410 外 围 的 NAND Flash 驱动 


19.5.1 S3C6410 NAND 控制 器 硬件 描述 


S3C6410 处 理 器 集成 了 一 个 NAND 控制 器 ， 它 支持 页 大 小 为 512 字 节 和 2048 字 节 的 SLC 或 
MLC NAND Flash。 对 SLC 工艺 Flash， 支 持 1-bit 的 硬件 ECC， 对 MLC 工艺 Flash， 支 持 4-bit 





或 8-bit 的 硬件 ECC. 
LDD6410 Jj 







































































F 发 板 连 接 了 一 块 K9F2G08 的 NAND Flash， 其 原理 如 图 19.7 所 示 ， 使 用 的 驱动 是 






































drivers/mtd/nand/s3c nandc， 它 同时 支持 S3C64XX、S5P64XX、S5PC1XX 处 理 器 ， 对 应 的 内 核 配 置 选 
项 为 MID NAND_S3C， 如 果 要 使 用 硬件 ECC 功能 ， 还 需要 使 能 MTD_NAND S3C HWECC. 
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19.7 LDD6410 开发 板 上 的 NAND 连接 原理 
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498 


19.5.2 S3C6410 nand chip 初始 化 与 NAND 探测 


S3C6410 的 NAND 驱动 以 platform 驱动 的 形式 存在 ， 在 执行 probe0 时 ， 初 始 化 nand_chip SE 
例 并 运行 nand_scan0 扫 描 NAND 设备 ， 最 后 调用 add_mtd_partitions() 添 加 板 文件 platform 中 定义 
的 分 区 表 。nand_chip 是 NAND Flash 驱动 的 核心 数据 结构 , 这 个 结构 体 中 的 成 员 直 接 对 应 着 NAND 
Flash 的 底层 操作 ， 针 对 具体 的 NAND 控制 器 情况 ， 本 驱动 中 初始 化 了 IO_ADDR R. IO ADDR W, 
cmd_ctrl0、dev_ready0、scan_bbtO 以 及 ECC 相关 的 信息 。 代 码 清单 19.14 所 示 为 S3C6410 外 国 
NAND Flash 驱动 的 nand_chip 初始 化 与 注册 过 程 。 
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代码 清单 19.14. S3C6410 nand chip 初始 化 与 注册 














1 static int s3c nand probe (struct platform device *pdev, enum s3c cpu type cpu type) 
2 ( 
E 
4 me (i e e mL «x yodieue eo elm ese. Gira) 4 
5 nandoIO ADDR R —- (char *)(s3c nand.regs H S3C NFDATA); 
6 nandoIO ADDR W = (char *)(s3c nand.regs + S3C NFDATA); 
zi nandocmd ctrl = s3c nand hwcontrol; 
8 nand-odev ready = s3c nand device ready; 
9 nandoscan bbt = s3c nand scan bbt; 
0 nand-ooptions = 0; 
dL 
2 #if defined(CONFIG MTD NAND S3C CACHEDPROG) 
3 nand-ooptions |= NAND CACHEPRG; 
4 #endif 
3 
6 #if defined(CONFIG MTD NAND S3C HWECC) 
qi nand-oecc.mode = NAND ECC HW; 
8 nandoecc.hwctl = s3c nand enable hwecc; 
9 nandoecc.calculate = s3c nand calculate ecc; 
20 nandoecc.correct = s3c nand correct data; 
2H 
22 s3c nand hwcontrol(0, NAND CMD READID, NAND NCE|NAND CLE| NAND CTRL CHANGE); 
23 s3c nand hwcontrol(0, 0x00, NAND CTRL CHANGE | NAND NCE | NAND ALE); 
24 s3c nand hwcontrol(0, 0x00, NAND NCE | NAND ALE); 
25 s3c nand hwcontrol(0, NAND CMD NONE, NAND NCE | NAND CTRL CHANGE); 
26 s3c nand device ready(0); 
2 
28 tmp = readb(nandoIO ADDR R); /* 制造 商 ID */ 
29 tmp = readb(nand-IO ADDR R); /* 设备 ID */ 
30 devID = tmp; 
ent 
92 for (j » 0; nand flash ids[j]l.name !- NULL; j--) ( 
953 if (tmp -- nand flash ids[j].id) ( 
34 type = &nand flash ids[j]; 
35 break; 
36 j 
S) ) 
38 
99 E. 
40 nandocellinfo = readb(nandoIO ADDR R); /* 第 3 个 字 节 */ 
41 tmp = readb(nand-IO ADDR R); [5E NN v) 
42 
43 if (!type-opagesize) { 
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44 if (((nandocellinfo »» 2) & 0x3) -- 0) ( 
45 nand type = S3C NAND TYPE SLC; 
46 nandoecc.size = 512; 


oo 


47 nandoecc.bytes = 4; 

48 if (devID == 0xd5) { 

49 /* Page size is 4Kbytes */ 

50 nandoecc.read page = s3c nand read page 8bit; 

5l r 

52 } eise { 

53 abus OO 2 «e tawa qu 39)). == 1099) 7/9 oe fü Bege (Josue TCC = 
54 ( 

55 /* Page size is 4Kbytes */ 

56 nandoecc.read page = s3c nand read page 8bit; 

577 XO 

58 j else 1 

9 

60 j 

61 } 

62 } else { 

63 nand type = S3C NAND TYPE MLC; 

64 nandooptions |= NAND NO SUBPAGE WRITE; NORE v IL MBO S 

65 if (devID == 0xd5) { 

66 /* Page size is 4Kbytes */ 

67 nandoecc.read page = s3c nand read page 8bit; 

68 nandoecc.write page = s3c nand write page 8bit; 

69 

70 ) else { 

van if ((1024 «« (tmp & 3)) = 4096) 
y [> Page sire de Ud 
T3 nandoecc.read page = s3c nand read page 8bit; 
74 nandoecc.write page = s3c nand write page 8bit; 





15 nandoecc.read oob = s3c nand read oob 8bit; 
76 

T3 I elge i 

78 nandoecc.read page = s3c nand read page 4bit; 
Te 

80 } 

81 Jj 

82 } 

83 

84 

85 printk("S3C NAND Driver is using hardware ECC.n"); 

86 #else 

87 nandoecc.mode = NAND ECC SOFT; 

88 printk("S3C NAND Driver is using software ECC.n"); 

89 #endif 

90 if (nand scan(s3c mtd, 1)) ( 

nt ret = -ENXIO; 

92 goto exit error; 

95 ] 

94 

95 /* 注册 分 区 信息 */ 

96 add mtd partitions(s3c mtd, partition info, plat info ,mtd part nr); 
9 ) 

98 
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9o 
100 


pr debug("initialized okMn"); 


return 0; 


dH eee 


102 


drivers/mtd/nand/s3c nand.c 是 一 个 platform Jj 
关 的 针对 NAND 的 platform 设备 和 分 


Flash 文件 系统 的 建立 





19.6.1 














入 操 











EXT3 等 将 无 法 


E 《必须 事 先 擦 
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Flash 





转换 层 


























区 信 Pun 即 Hf. 


于 无 法 重复 地 在 Flash 的 同一 块 存储 位 置 做 写 

















除 该 块 后 才能 再 写 入 )， 因 
般 在 硬盘 上 使 用 的 文件 系统 , 如 VFAT、NTFS、EXT2、 




















F} 

















系统 ， 则 必须 透 过 一 层 转换 层 (Translation Layer) 来 
(Logical Block Address) 对 应 到 Flash 
位 置 ， 使 系统 能 把 Flash 当 作 普通 的 硬 
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将 逻辑 块 地 址 
存储 器 的 物理 









































样 处 理 ， 
Layer)。FTL 应 用 
NAND Flash， 如 图 


















































我 们 称 这 





JÆ Flash E, 


层 为 FTL (Flash Translation 
T NOR Flash， 而 NEFTL 则 应 用 于 
19.8 所 示 。 


此 一 





为 了 沿用 这 些 文件 













































































GD 
l 
FAT16/FAT32/ 
NTFS/Ext2 等 


FTL/NFTL 
| 
[ | wmm | | 
| 
| 
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区 动 ， 我 们 在 LDD6410 的 BSP FRA 
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1 1 
一 个 闪存 转换 层 的 最 简单 的 实现 就 是 将 模拟 的 pre 4 
块 设备 一 对 一 地 映射 到 闪存 上 。 举 例 来 说 ， 当 上 层 ka 
E OCT E ZR AREE — Ae, A F E 19.8 FTL NFTL 
要 做 下 面 的 操作 来 完成 这 个 写 请 求 。 
(1) 将 这 个 扇 区 所 在 探 除 块 的 数据 读 到 内 存 中 ， 放 在 缓存 中 。 
(2) 将 缓存 中 与 这 个 扇 区 对 应 的 内 容 用 新 的 内 容 蔡 换 。 
(D 对 该 擦 除 块 执行 擦 除 操作 。 
(4) 将 缓冲 中 的 数据 写 回 该 擦 除 块 。 
这 种 实现 方式 的 缺点 如 下 。 
e 效率 低 ， 对 一 个 扇 区 的 更 新 要 重 写 整个 探 除 块 上 的 数据 ， 造 成 数据 带宽 很 大 的 浪费 。 可 
行 的 办 法 是 只 有 当 文 件 系统 的 写 请 求 超过 了 一 个 擦 除 块 的 边界 的 时 候 ， 才 去 执行 对 闪存 
的 擦 除 、 写 回 操作 (这 种 更 新 方式 也 HM out-of-place)。 
e ”没有 提供 磨损 平衡 ， 那 些 被 频繁 更 新 的 数据 所 在 擦 除 块 将 首先 变 成 坏 块 。 
e 非常 不 安全 ， 很 容易 引起 数据 的 丢失 。 如 果 在 上 面 的 第 (GO 步 和 第 (4) 步 之 间 发 生 了 
突然 掉 电 ， 那 么 整个 擦 除 块 中 的 数据 就 全 部 丢失 了 。 
为 了 解决 上 面 这 种 实现 方式 的 问题 ， 闪 存 转换 层 不 能 只 是 简单 地 实现 块 设备 与 内 存 的 一 一 映 
射 ， 它 还 需要 将 模拟 块 设备 的 扇 区 存储 在 闪存 的 不 同位 置 ， 并 且 维 持 扇 区 到 闪存 的 映射 关系 。 而 
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为 了 进行 垃圾 回收 (Garbage Collection)， 闪 存 转 换 层 必须 能 理解 上 层 文 件 系统 的 语义 。 这 样 实 现 
导致 的 最 大 问题 就 是 效率 不 高 ， 有 具体 来 说 ， 闪 存 转换 层 为 了 能 理解 上 层 文 件 系 统 的 语义 ， 必 须 对 
文件 系统 的 每 个 写 请 求 进行 解析 ， 因 此 导致 写 操作 的 性 能 下 降 。 另 外 ， 从 软件 的 架构 上 来 讲 ， 要 
求 文件 系统 下 面 的 一 层 去 理解 文件 系统 的 语义 ， 也 不 太 合 理 。 因 此 ， 在 Flash 上 ， 应 尽 可 能 地 避 
免 使 用 传统 的 依赖 闪存 转换 层 的 文件 系统 ， 最 好 应 采用 专门 的 针对 Flash 的 文件 系统 。 
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19.6.2 CramFS 


ERAR Linux 环境 中 ， 许 多 人 会 采用 RAMDISK 来 储存 文件 系统 的 内 容 ，RAMDISK 的 含 
义 是 在 启动 时 ， 把 一 部 份 内 存 虚拟 成 磁盘 ， 并 且 把 之 前 准备 好 的 文件 系统 映像 文件 解压 缩 到 该 
RAMDISK 环境 中 。 假设 压 缩 后 的 文件 系统 映像 为 8MB， 存 放 于 Flash， 解 压缩 后 为 1 6MB， 如 果 
采用 RAMDISK， 将 需要 8MB 的 Flash 和 16MB 的 RAM 空间 ， 而 采用 CramFS 后 ， 就 不 再 需要 
消耗 16MB 的 RAM 空间 。 

CramFS 是 Linus Torvalds 参与 开发 的 文件 系统 ， 在 linux/fs/cramfs 中 可 以 找到 CramFS 的 源 
代码 。CramFS 是 一 种 压缩 的 只 读 文件 系统 ， 当 浏览 Flash 中 的 目录 或 读 取 文 件 时 ，CramFS 文件 
系统 会 动态 地 计算 出 压缩 后 的 数据 所 储存 的 位 置 ， 并 实时 地 解压 缩 到 内 存 中 ， 对 于 用 户 来 说 ， 使 
用 CramFS 与 RAMDISK 感觉 不 出 使 用 上 的 差异 性 。 

CramFS 工具 的 下 载 地 址 为 http://sourceforge.net/projects/cramfs/， 通 过 如 下 命令 可 以 创建 
CramFS 文件 系统 映像 : 


mkcramfs my cramfs/ cramfs.img (my_cramfs 是 我 们 要 创建 映像 的 目录 ) 
如 下 命令 将 生成 的 cramfsimg 映像 复制 到 Flash 的 第 一 个 分 区 并 mount 到 /mnt/nor 目录 : 
cp cramfs.img /dev/mtdl 


















































































































































































































































































































































mount -cramfs /dev/mtdblock1l /mnt/nor 


很 多 时 候 ， 工 程 中 需要 基于 已 有 的 文件 系统 映像 添加 、 删 除 一 些 文件 后 建立 新 的 文件 系统 映 
像 ， 这 时 候 并 不 需要 完全 重新 操作 ， 可 用 如 下 的 方法 。 
(1) 将 映像 以 loop 方式 挂 载 到 某 目 录 。 


mkdir tmpdir 

















































































































mount rootfs.cramfs tmpdir -o loop 

ca ne 

(20 压缩 被 挂 载 的 文件 系统 。 

tar -cvf ../rootfs.tar ./ 将 tmpdir 中 的 内 容 打 包 放 在 其 父 目录 下 
umount tmpdir 
(3) 解压 缩 文 件 系统 到 新 目录 。 


mkdir rootfs 
























































二 ROSE tar =C rootfs 
(4) 修改 新 目录 OXE Æ rootfs) 中 的 内 容 ， 以 符合 新 的 需要 。 
(5) 重新 创建 映像 文件 。 


Mmkeramfts ToOtES footfs.-cramis 


19.6.3 JFFS/JFFS2 


JFFS 是 由 瑞典 Axis Communications AB 公司 开发 的 ， 于 1999 年 末 基 于 GNU GPL 发 布 的 文 
件 系 统 。 最 初 的 发 布 版 本 基于 Linux 2.0， 后 来 Red Hat 将 它 移植 到 Linux 2.2， 在 使 用 的 过 程 中 ， 
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JFFS 设计 中 的 局 限 被 不 断 地 暴露 出 来 。 于 是 在 2001 年 初 ，Red Hat 决定 实现 一 个 新 的 JFFS2 
Chttp:/*www.infradead.org )。 

JFFS2 是 一 个 日 志 结构 〈log-structured) 的 文件 系统 ,， 它 在 闪存 上 顺序 地 存储 包含 数据 和 原 数 
据 (meta-data〉 的 节点 。JFFS2 的 日 志 结构 存储 方式 使 得 它 能 对 闪存 进行 out-of-place 更 新 ， 而 不 
是 磁盘 所 采用 的 in-place 更 新 方式 。 它 提供 的 垃圾 回收 机 制 ， 使 得 我 们 不 需要 马上 对 擦 写 越界 的 
块 进行 擦 写 ， 而 只 需要 对 其 设置 一 个 标志 ， 标 明 为 “ 脏 ” 块 。 当 可 用 的 块 数 不 足 时 ， 垃 圾 回收 机 
制 才 开 始 回收 这 些 节点 。 同 时 ， 由 于 JFFS2 基于 日 志 结 构 ， 在 意外 掉 电 后 仍然 可 以 保持 数据 的 完 
整 性 ， 而 不 会 丢失 数据 。 因 此 ，JFFS2 成 为 了 目前 Flash 上 应 用 最 广泛 的 文件 系统 。 

然而 , JFFS2 挂 载 时 需要 扫描 整 块 Flash 以 确定 节点 的 合法 性 以 及 建立 必要 的 数据 结构 ,这 使 
得 JFFS2 挂 载 时 间 比 较 长 。 又 由 于 JEFS2 将 节点 信息 保存 在 内 存 中 ， 使 得 它 所 占用 的 内 存量 和 六 
点 数目 成 正比 。 再 者 ， 由 于 JFFS2 通过 随机 方式 来 实现 磨损 平衡 ， 它 不 能 保证 磨损 平衡 的 确定 性 。 
因此 ， 人 们 提出 了 JFFS3， 它 就 是 为 解决 JFFS2 的 这 些 缺 陷 而 设计 的 。 
和 CramFS 一 样 ， 也 存在 一 个 制作 JFFS2 文件 系统 的 工具 mkfs.jffs2〈 包 含 在 mtd-utils ， 
执行 如 下 命令 即 可 生成 所 要 的 映 象 : 
./mkfs.jffs2 -d my jffs2/ -o jffs2.img (my_jffs2 是 我 们 要 制作 映像 的 目录 ) 
使 用 mkfsjffs2 制作 映像 的 时 候 ， 要 注意 指定 正确 的 擦 除 块 大 小 和 页 面 大 小 ， 对 于 NAND 
Flash， 应 使 用 “-n” 去 掉 生 成 映像 中 的 clean marker。 

接 下 来 将 jffs2.img 复制 到 Flash 第 1 个 分 区 (复制 到 MTD 字符 设备 )， 如 下 所 示 : 

cp jffs2.img /dev/mtdl 

之 后 ， 就 可 以 将 对 应 的 块 设备 mount 到 Linux 的 目录 了 ， 如 下 所 示 : 

mount -t jffs2 /dev/mtdblock1 /mnt/nor 

对 于 NAND Flash， 应 使 用 mtd-utils 中 的 nandwrite 工具 进行 jffs2 映像 向 NAND Flash 的 烧 录 ， 
在 烧 录 前 可 以 使 用 flash. eraseall 擦 除 Flash, JÆ OOB 区 域 加 上 JFFS2 需要 的 clean marker. 

LDD6410 开发 板 的 文件 系统 中 已 包含 mtd-utils 系列 工具 。mtd-utils 的 当前 最 新 版 本 为 1.3.1， 
下 载 地 址 为 : ftp:/*ftp.infradead.org/pub/mtd-utils/mtd-utils-1.3.1.tar.bz2。 


19.6.4 YAFFS/YAFFS2 


YAFFS C Yet Another Flash File System, http:/*www.yaffs.net) 文件 系统 是 专门 针对 NAND 
闪存 设计 的 先入 式 文件 系统 ， 目 前 有 YAFFS 和 YAFFS2 两 个 版 本 ， 两 个 版 本 的 主要 区 别 之 一 
在 于 YAFFS2 能 够 更 好 地 支持 大 容量 的 NAND Flash 芯片 ,而 前 者 只 针对 页 大 小 为 512 字 节 的 
NAND. 

YAFFS 文件 系统 有 些 类 似 于 JFFS/JFFS2 文件 系统 , 与 之 不 同 的 是 JFFS1/2 文件 系统 最 初 
是 针对 NOR Flash 的 应 用 场合 设计 的 , 而 NOR Flash 和 NAND Flash 本 质 上 有 较 大 的 区 别 ,所 
以 尽管 JFFS1/2 文件 系统 也 能 应 用 于 NAND Flash， 但 由 于 它 在 内 存 占 用 和 启动 时 间 方 面 针 对 
NOR 的 特性 做 了 一 些 取 舍 , 所 以 对 NAND 来 说 通常 并 不 是 最 优 的 方案 。 NAND 上 的 每 一 页 数 
据 都 有 额外 的 空间 用 来 存储 附加 信息 ，YAFFS 正好 利用 了 该 空间 中 一 部 分 来 存储 文件 系统 相 
关 的 内 容 。 

YAFFS 和 JFFS 都 提供 了 写 均 衡 、 垃 圾 收集 等 底层 操作 ， 它 们 的 不 同 之 处 如 下 。 

e JFFS 是 一 种 日 志文 件 系统 ， 通 过 日 志 机 制 保证 文件 系统 的 稳定 性 。YAFFS 仅仅 借鉴 了 
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较 大 的 系统 。 


YAFFS 还 带 有 NAND 芯片 驱动 ， 并 为 众 入 式 系统 提供 了 直接 访问 文件 系统 的 APL， 








日 志 系统 的 思想 ， 不 提供 日 志 机 能 ， 所 以 稳定 性 不 如 下 FS， 但 是 资源 占用 少 。 
JFFS 中 使 用 多 级 链表 管理 需要 


块 ， 通 过 这 利 
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收 的 脏 块 , 并 且 使 用 系统 生成 伪 随 机 变量 决定 要 回收 的 






























































方法 能 提供 较 好 的 写 均衡 ， 在 YAFFS 中 是 从 头 到 尾 对 块 搜索 ， 所 以 在 垃 
圾 收集 上 JFFS 的 速度 慢 ， 但 是 能 延长 NAND 的 寿命 。 
JFFS 支持 文件 压缩 ， 适 合 存储 容量 较 小 的 系统 ， YAFFS 不 支持 压缩 ， 更 适合 存储 容量 
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户 可 以 不 使 





























Linux 中 的 MTD 和 VFS， 直 接 对 文件 进行 操作 (如 图 19.8)。 尽 管 如 此 ， 























NAND Flash 大 多 还 是 采用 MTD+YAFFS 的 模式 。 











NOR record 
NOR Flash 








File I1O 


VFS | YAFFS Direct 


NAND record 
NAND Flash NAND emulator 
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Smartmedia 
block driver 























@ YAFFS 使 用 OOB 组 织 文件 结构 信息 ， 而 JFFS 直接 将 节点 信息 保存 在 NAND 数据 区 域 


(1) 


在 Linux 









































Y AFFS 源 


只 需要 在 内 核 ! 


























fs/yaffs ! 











的 对 应 文件 即 可 





里 面 ， 因 此 YAFFS 在 mount 时 只 需 读 取 OOB， 其 mount 时 间 远 小 于 JFFS。 
2.6 内 核 下 ，YAFFS 文件 系统 的 移植 非常 简单 ， 主 要 包括 以 下 工作 。 

复制 YAFFS 源 代 码 到 Linux 源码 树 。 
建立 YAFFS 目录 fs/yaffs， 并 把 下 载 的 YAFFS RBA h 
代码 包括 yaffs_ecc.c、yaffs fileem.c、yaffs fs.c. yaffs guts.c. yaffs mtdif.c. yaffs ramem.c)， 下 载 的 
尺码 已 包含 了 Kconfig 和 Makefile, 因此 只 需要 修改 fs 目录 下 的 Kconfig 和 Makefile 并 引用 
， 方 法 是 : 在 fs/Kconfig 中 增加 source "fs/yaffs/Kconfig"; 在 fs/Makefile : 









































imm 
| 





到 该 目录 下 面 (YAFFS 





















































增加 obj-$(CONFIG YAFFS FS) += yaffs/。 






















































































(20 配置 内 核 编译 选项 。 
在 采用 make menuconfig 等 方式 配置 内 核 编译 选项 时 ， 除 了 应 该 选中 MTD 系统 及 目标 板 上 
Flash 的 驱动 以 外 ， 也 必须 选中 对 YAFFS 的 支持 ， 如 下 所 示 : 
File systems --— 
Miscellaneous filesystems --— 
«*» Yet Another Flash Filing System(YAFFS) file system support 


[ST 
I7] 








NAND mtd support 
Use ECC functions of the generic MTD-NAND driver 
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Use Linux file caching lay 


Turn off debug chunk erase 
Cache short names in RAM 


(3) 挂 载 Y AFFS. 


ITA 


check 





YAFFS 源 代码 包 的 utils 目录 下 包含 了 mkyaffs 工具 ， 可 以 用 它 格式 化 Flash， 例 如 运行 
mkyaffs /dev/mtd3 将 用 YAFFS 文件 系统 格式 化 NAND 的 第 3 个 分 区 ,之 后 我 们 可 以 运行 如 下 





命令 挂 载 YAFFS: 
mount -t yaffs /dev/mtdblock3 /mn 


t/nand 











此 后 ， 对 /mnt/nand 的 操作 就 是 对 /dev/mtdblock3 的 操作 。 
如 果 运 行 如 下 命令 将 根 文件 系统 复制 到 /mnt/Flash0: 








mount -t yaffs /dev/mtdblock3 /mn 
cp (our rootfs) /mnt/FlashO0 
umount /mnt/nand 








t/nand 


则 重新 启动 ， 并 修改 Linux 启动 参数 中 root 为 (仅仅 是 举例 ， 具 体系 统 的 启动 命令 行 很 可 能 








会 有 改变 ): 





param set linux cmd line "noinitrd root-/dev/mtdblock3 init=/linuxrc console=ttys0" 


之 后 就 可 以 直接 以 /dev/mtdblock3 中 的 村 




















民 文 伯 





F 系 统 启动 了 。 




















YAFFS2 的 移植 方法 与 YAFFS 类 似 ， 而 且 ， 目 前 我 们 已 经 没有 必要 再 移植 YAFFS 了 ， 因 为 
YAFFS2 的 源码 直接 包含 了 对 YAFFS 的 支持 。LDD6410 开发 板 对 NAND 采用 了 YAFFS2 文件 系 
































统 ， 其 内 核 已 完整 支持 YAFFS2。 
YAFFS 源 代码 的 下 载 地 址 为 : 






































http:/*www.alephl.co.uk/cgi-bin/viewcvs.cgi/yaffs.tar.gz?view-tar 


YAFFS2 源 代码 的 下 载 地 址 为 : 


http:/*www.alephl.co.uk/cgi-bin/viewcvs.cgi/yaffs2.tar.gz?view-tar 


YAFFS2 源 代 码 包 的 utils 目录 下 包含 了 mkyaffsimage. mkyaffs2image 工具 的 源 代 码 ， 编 
译 即 可 生成 mkyaffsimage、mkyaffs2image 工具 




















于 页 大 小 为 512Byte 的 NAND Flash, 
YAFFS2. 


P, 


运行 “mkyaffsimage dir imagename” 可 以 制作 出 YAFFS 文件 系统 的 镜像 。 需 要 注意 的 
像 文件 与 通常 的 文件 系统 的 映像 文件 不 同 , 因为 
在 image 文件 里 除了 以 512 字 节 为 单位 的 一 个 页 的 数据 外 ， 同 时 紧 跟 在 后 还 包括 了 16 字 节 为 
单位 的 NAND OOB 数据 ， 因 此 ，YAFFS 映像 的 下 载 工具 必须 将 映像 中 的 额外 数据 写 入 到 

















是 , 使 用 mkyaffsimage 制作 出 来 的 YAFFS W 


















































NAND 的 OOB 中 。 






























































对 于 页 大 小 为 2KB 的 NAND Flash 而 言 ， 只 能 使 用 























o YAFFS 不 支持 大 页 的 NAND Flash， 一 般 只 



























































YAFFS 映像 中 的 OOB 数据 转换 为 适合 于 在 系统 ! 
对 于 各 种 文件 系统 而 言 ， 如果 想 在 启动 过 程 ! 











































































































nandwrite 工具 “名 义 上 ”可 以 支持 YAFFS 映像 的 烧 录 , 但 是 考虑 到 实际 上 NAND ECC 模式 
和 分 布 的 不 确定 性 ， 而 mkyaffsimage 生成 的 映像 采用 固定 的 OOB 区 域 分 布 ， 因 此 ， 为 了 完全 
持 自 适应 的 YAFFS 映像 烧 录 ， 必 须 在 烧 录 工具 





























解析 NAND 驱动 的 OOB layout， 再 将 记录 在 
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E 
NAND 存放 的 形式 。 
































将 Flash 的 xxxfs 文件 系统 分 区 挂 载 到 某 个 目 




















录 ， 可 以 通过 修改 启动 的 rc 脚本 或 /etc/fstab 来 完成 ， 需 在 启动 re 脚本 中 增加 “mount -t xxxfs 














/dev/mtdblock3 /mntFlash0” 类 似 语句 , A 





E fstab ! 





00” 类 似 语句 。 








增加 “/dev/mtdblock3 /mnt/Flash0 xxxfs defaults 








Flash 设备 驱动 


oo06 


19.6.5 UBI/UBIFS 


UBIFS 是 由 Thomas Gleixner, Artem Bityutskiy 等 人 于 2006 年 发 起 ， 致 力 于 开发 性 能 
越 、 扩 展 性 高 的 Flash 专用 文件 系统 。UBI Cunsorted block images? 是 一 种 类 似 于 LVM R3 


































































































辑 卷 管理 层 , 主要 实现 损益 均衡 , 逻辑 擦 除 块 、 卷 管理 和 坏 块 管理 等 , 而 UBIFS 则 是 基于 UBI 
的 Flash 日 志文 件 系统 。UBIFS 并 不 直接 工作 于 MTD 之 上 而 是 工作 于 UBI 卷 之 上 ,这 是 它 与 








JFFS2. YAFFS2 的 一 个 显著 区 别 。 
为 了 使 用 UBIFS， 我 们 需要 在 配置 内 核 时 使 能 如 下 选项 : 


Device Drivers 
Memory Technology Device (MTD) 





















































SUDPOLT Tr 
UBI - Unsorted block images --— 
«*» Enable UBI 
«*» MTD devices emulation driver(gluebi) (NEW) 
File systems 
Miscellaneous filesystems 
«*» UBIFS file system support 


下 面 给 出 一 个 使 用 制作 、 烧 录 和 使 用 UBIFS 的 过 程 的 例子 。 

(1) 在 PC 上 通过 mtd-utils 制作 UBI 映像 : 

OO eS mi ZOS S90 0 OS mg 
ot =O WS no a AAS ey I Cp Ne Ot em 


以 上 命令 对 应 的 Flash 的 page 大 小 为 2048 字 节 ，subpage 大 小 为 512 字 节 
为 128KB 。rootfs 为 要 制作 的 根 文件 系统 的 目录 。 
(D 在 目标 机 上 烧 录 映像 : 


root:/» ubiformat /dev/mtdl -s 512 -f ubi.img 
ubiformat: mtdl (NAND), size 130023424 bytes (124.0 MiB), 


一 一 一 


一 一 一 






















































































MRES Oe 





eraseblock 大 小 























131072 eraseblocks of 131072 














bytes (128.0 KiB), min. I/O size 2048 bytes 
libscan: scanning eraseblock 991 -- 100 $ complete 
ubiformat: 992 eraseblocks are supposedly empty 
ubiformat: flashing eraseblock 15 -- 100 $ complete 
ubiformat: formatting eraseblock 991 -- 100 $ complete 
(3) 通过 ubiattach 关联 MTD UBI: 
tootc/» nbrattach /dev/ubioctri -mw i 
UBI: attaching mtdl to ubiO 
UBI: physical eraseblock size: 131072 bytes (128 KiB) 
UB logical eraseblock size: 129024 bytes 
UB smallest flash I/O unit: 2048 
UB sub-page size: 517 
UBI: VID header offset: SP MEC adinim ec 5325 
UB data offset: 2048 
UBI: volume 0 ("rootfs") re-sized from 17 to 979 LEBs 
UB attached mtdl1 to ubiO 
UBI: MTD device name: "file system(nand)" 
UBI: MTD device size: 124 MiB 
UB number of good PEBs: 992 
UB number of bad PEBs: 0 
UBI: max. allowed volumes: 128 
UBI: wear-leveling threshold: 4096 
UB number of internal volumes: 1 
UBI: number of user volumes: 1 
UBI: available PEBs: 0 
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UBI: total number of reserved PEBs: 992 

UBI: number of PEBs reserved for bad PEB handling: 9 

UBI: max/mean erase counter: 0/0 

UBI: image sequence number: 0 

UBI: background thread "ubi bgtO0d" started, PID 179 

UBI device number 0, total 992 LEBs (127991808 bytes, 122.1 MiB), available 0 LEBs (0 
bytes), LEB size 129024 bytes (126.0 KiB) 

(4) 挂 载 UBIFS: 

TOGES > mome =€ Woie WILS r OOTES MNE 

UBIFS: mounted UBI device 0, volume 0, name "rootfs" 

UBIFS: file system size: 124895232 bytes (121968 KiB, 119 MiB, 968 LEBs) 

UBIFS: journal size: 9033728 bytes (8822 KiB, 8 MiB, 71 LEBsS) 

UBIFS: media format: w4/rO0 (latest is w4/r0) 

UBIFS: default compressor: lzo 

UBIFS: reserved for root: O0 bytes (0 KiB) 


(5) 现在 我 们 可 以 通过 mount 和 ubinfo 命令 查看 下 结果 : 


root:/» mount 









































rootfs on / type rootfs (rw) 
proc on /proc type proc (rw,nosuid,nodev,noexec,relatime) 
sysfs on /sys type sysfs (rw,nosuid,nodev,noexec,relatime) 


ubi0:rootfs on /mnt type ubifs (rw,relatime) 


roobt:/mnt» ubinfoe 

UBI version: 1 

Count of UBI devices: 1 

UBI control device major/minor: 10:63 
Present UBI devices: ubiO 


UBIFS 被 认为 是 下 一 代 的 下 FS2， 它 也 支持 运行 时 压缩 ， 但 是 挂 载 比 JFFS2 快 。 另 外 ， 被 用 
F NAND 时 , 其 设计 以 及 性 能 都 优越 于 YAFFS2, 特别 是 工作 在 大 页 MLC NAND Flash 上 面 。 因 
此 ， 目 前 许多 项 目 中 都 正在 使 用 UBIFS 替代 YAFFS2. 


19 .7 = 


本 章 主要 讲解 了 Linux 系统 中 MTD 系统 的 层次 和 接口 ，NOR 和 NAND Flash 驱动 的 设计 方 
法 及 如 何在 其 上 建立 Flash 文件 系统 。 
于 引入 了 MTD 系统 以 及 MTD 下 层 的 通用 NOR 和 NAND 驱动 ，Linux 中 NOR 和 NAND 
Flash 芯片 级 驱动 的 设计 难度 被 大 大 降低 。 尤 其 对 于 NOR 而 言 ，drivers/mtd/maps/physmap.c 驱动 
文 持 了 绝 大 不 多 情况 下 的 NOR 驱动 , 使 得 移植 NOR 驱动 的 工作 仪 仅 只 需要 在 BSP 中 添加 相关 
的 platform 信息 。 

在 串口 驱动 部 分 ， 本 章 讲 解 了 tty_driver 到 uart_driver 的 角色 转换 ， 在 Flash 驱动 中 ， 本 章 讲 
解 了 mtd info 向 map info/nand chip 的 转移 ， 可 以 说 ，Linux 驱动 的 这 种 分 层 设计 思想 是 贯穿 
种 Linux 驱动 框架 始终 的 。 
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在 Linux 系统 中 ， 提 供 了 主机 侧 和 设备 侧 视角 的 USB 驱动 框架 ， 本 
章 主要 讲解 从 主机 侧 角度 看 到 的 USB 主机 控制 器 驱动 和 设备 驱动 ， 以 及 
从 设备 侧 角 度 看 到 的 设备 控制 器 和 gadget 驱动 。 
20.1 节 给 出 了 Linux 系统 中 USB 驱动 的 整体 视图 ， 讲 解 了 Linux 中 
主机 侧 和 设备 侧 角 度 的 USB 驱动 层次 。 

从 主机 侧 的 角度 而 言 ， 需 要 编写 的 USB 驱动 程序 包括 主机 控制 器 驱 
动 和 设备 驱动 两 类 ，USB 主机 控制 器 驱动 程序 控制 插入 其 中 的 USB 设备 ， 
而 USB 设备 驱动 程序 控制 该 设备 如 何 作为 从 设备 与 主机 通信 。 本 章 20.2 
节 分 析 了 USB 主机 控制 器 驱动 的 结构 并 给 出 LDD6410 USB 1.1 主 机 实例 ， 
20.3 节 讲 解 了 USB 设备 驱动 的 结构 及 其 设备 请 求 块 处 理 过 程 并 给 出 了 
USB 键盘 驱动 作为 实例 。 
从 设备 侧 的 角度 而 言 ， 包 含 编写 USB 设备 控制 器 (UDC) 驱动 和 gadget 
驱动 两 类 , 20.4 对 UDC 和 gadget 驱动 进行 了 讲解 , 并 给 出 了 LDD6410 UDC 
和 file storage gadget 作为 实例 。 

20.5 节 简 单 地 介绍 了 一 下 USB OTG 驱动 。 

20.1 节 与 20.2-20.5 节 是 整体 与 部 分 的 关系 。 
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Linux USB 驱动 层次 


20.1.1 主机 侧 与 设备 侧 USB 驱动 

USB 采用 树 形 拓扑 结构 ， 主 机 侧 和 设备 侧 的 USB 控制 器 分 别称 为 主机 控制 器 (Host 
Controller) 和 USB 设备 控制 器 (UDC)， 每 条 总 线 上 只 有 一 个 主机 控制 器 ， 负 责 协 调 主机 和 设备 
间 的 通信 ， 而 设备 不 能 主动 向 主机 发 送 任何 消息 。 如 图 20.1 所 示 ， 在 Linux RAF, USB 驱动 可 
以 从 两 个 角度 去 观察 ， 一 个 角度 是 主机 侧 ， 一 个 角度 是 设备 侧 。 






























































































































































































从 运行 Linux 的 主机 侧 看 从 运行 Linux 的 设备 侧 看 
USB 设 备 驱 动 5 i 
Mos a Ai Gadget 驱 动 (file storage/serial...) 
a 
USB 核 心 Gadget API 
PN 
主机 控制 器 驱动 OHCVEHCLUHCI UDC 驱动 Comap/pxa2xx...) 














USB 控 制 器 OHCIEHCIUHCI 
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20.1 Linux USB 驱动 总 体 结构 


























如 图 20.1 的 左 侧 所 示 ， 从 主机 侧 的 观念 去 看 ， 在 Linux 驱动 中 ，USB 驱动 处 于 最 底层 的 是 
USB 主机 控制 器 硬件 ， 在 其 之 上 运行 的 是 USB 主机 控制 器 驱动 ， 主 机 控制 器 之 上 为 USB 核心 层 ， 
i ES USB WE EUG GALERIUS. Bus. USB 转 串 口 等 设备 驱动 )。 因 此 ,在 主机 
则 的 层次 结构 中 ， 要 实现 的 USB 驱动 包括 两 类 : USB 主机 控制 器 驱动 和 USB 设备 驱动 ， 前 者 控 
制 插入 其 中 的 USB 设备 , 后 者 控制 USB 设备 如 何 与 主机 通信 。Linux 内 核 USB 核心 负责 USB IK 
动 管理 和 协议 处 理 的 主要 工作 。 主机 控制 器 驱动 和 设备 驱动 之 间 的 USB 核心 非常 重要 , 其 功能 

括 : 通过 定义 一 些 数据 结构 、 宏 和 功能 函数 ， 向 上 为 设备 驱动 提供 编程 接口 ， 向 下 为 USB 主机 控 
制 器 驱动 提供 编程 接口 通过 全 局 变量 维护 整个 系统 的 USB 设备 信息 ; 完成 设备 热 插 拔 控制 、 总 
线 数据 传输 控制 等 。 
如 图 20.1 的 右 侧 所 示 ，Linux 内 核 中 USB 设备 侧 驱动 程序 分 为 3 个 层次 : UDC 驱动 程序 、 

Gadget API 和 Gadget 驱动 程序 。UDC 驱动 程序 直接 访问 和 硬件， 控制 USB 设备 和 主机 间 的 底层 通 
信 ， 向 上 层 提供 与 硬件 相关 操作 的 回调 函数 。 当 前 Gadget API 是 UDC 驱动 程序 回调 函数 的 简单 
包装 。Gadget 驱动 程序 具体 控制 USB 设备 功能 的 实现 ， 使 设备 表现 出 “网 络 连接 ”“ 打 印 机 ” 
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或 “USB Mass Storage” 等 特性 ， 它 使 用 Gadget API 控制 UDC 实现 上 述 功 能 。Gadget API 把 下 
的 UDC 驱动 程序 和 上 层 的 Gadget 驱动 程序 隔离 开 ， 使 得 在 Linux 系统 中 编写 USB 设备 侧 驱 动 程 
序 时 能 够 把 功能 的 实现 和 底层 通信 分 离 。 


20.1.2 RA., ME, ELI. WA 

在 USB 设备 的 逻辑 组 织 中 ， 包 含 设备 、 配 置 、 接 口 和 端点 4 个 层次 。 

每 个 USB 设备 都 提供 了 不 同 级 别 的 配置 信息 ,可 以 包含 一 个 或 多 个 配置 , 不 同 的 配置 使 设备 
表现 出 不 同 的 功能 组 合 〈 在 探测 /连接 期 间 需 从 其 中 选 定 一 个 )， 配 置 由 多 个 接口 组 成 。 

在 USB 协议 中 ， 接 口 由 多 个 端点 组 成 ， 代 表 一 个 基本 的 功能 ， 是 USB 设备 驱动 程序 控制 的 
对 象 ， 一 个 功能 复杂 的 USB 设备 可 以 具有 多 个 接口 。 每 个 配置 中 可 以 有 多 个 接口 ， 而 设备 接口 是 
端点 的 汇集 (collection)。 例 如 ，USB 扬声器 可 以 包含 一 个 音频 接口 以 及 对 旋钮 和 按钮 的 接口 。 
一 个 配置 中 的 所 有 接口 可 以 同时 有 效 ， 并 可 被 不 同 的 驱动 程序 连接 。 每 个 接口 可 以 有 备用 接口 ， 
以 提供 不 同 质量 的 服务 参数 。 
端点 是 USB 通信 的 最 基本 形式 ， 每 一 个 USB 设备 接口 在 主机 看 来 就 是 一 个 端点 的 集合 。 主 
机 只 能 通过 端点 与 设备 进行 通信 ， 以 使 用 设备 的 功能 。 在 USB 系统 中 每 一 个 端点 都 有 惟一 的 地 址 ， 
这 是 由 设备 地 址 和 端点 号 给 出 的 。 每 个 端点 都 有 一 定 的 属性 ， 其 中 包括 传输 方式 、 总 线 访 问 频率 、 
带宽 、 端 点 号 和 数据 包 的 最 大 容量 等 。 一 个 USB 端点 只 能 在 一 个 方向 承载 数据 ， 或 者 从 主机 到 设 
备 〈 称 为 输出 端点 )， 或 者 从 设备 到 主机 《〈 称 为 输入 端点 )， 因 此 端点 可 看 作 一 个 单 向 的 管道 。 端 
点 0 通常 为 控制 端点 , 用 于 设备 初始 化 参数 等 。 只 要 设备 连接 到 USB 上 并 且 上 电 端 点 0 就 可 以 被 
访问 。 端 点 1、2 等 一 般 用 作 数 据 端 点 ， 存 放 主 机 与 设备 间 往 来 的 数据 。 

总 体 而 言 ，USB 设备 非常 复杂 ， 由 许多 不 同 的 逻辑 单元 组 成 ， 如 图 20.2 所 示 ， 这 些 单元 之 间 


的 关系 如 下 : 
| 设备 描述 符 | 
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图 20.2 USB 设备 、 配 置 、 接 口 和 端点 
















































































@ 设备 通常 有 一 个 或 多 个 配置 ; 

e 配置 通常 有 一 个 或 多 个 接口 ; 

@ 接口 通常 有 一 个 或 多 个 设置 ; 

@ 接口 有 零 或 多 个 端点 。 

这 种 层次 化 配置 信息 在 设备 中 通过 一 组 标准 的 描述 符 来 描述 ， 如 下 所 示 。 
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@ 设备 描述 符 : 关于 设备 的 通用 信息 ， 如 供应 商 ID、 产 品 ID 和 修订 ID， 支 持 的 设备 类 、 
子 类 和 适用 的 协议 以 及 默认 端点 的 最 大 包 大 小 等 。 在 Linux 内 核 中 ，USB 设备 用 
usb device 结构 体 来 描述 ，USB 设备 描述 符 定义 为 usb device descriptor 结构 体 ， 如 代码 
清单 20.1 所 示 。 























代码 清单 20.1 usb device descriptor 结构 体 
struct usb device descriptor { 
.u8 bLength; /* 描述 符 长 度 */ 
.u8 bDescriptorType; /* 描述 符 类 型 编号 */ 
/* USB 版 本 号 */ 
. u8 bDeviceClass; /* USB 分 配 的 设备 类 code */ 
.u8 bDeviceSubClass;/* USB 分 配 的 子 类 code */ 
.u8 bDeviceProtocol; /* USB 分 配 的 协议 code */ 


F 
2 
3 
4 
5 . .le16 bcdUSB; 
6 
7 
8 
9 .u8 bMaxPacketSize0; /* endpoint0 最 大 包 大 小 */ 


.lel6 idVendor; 
.lel6 idProduct; 


.lel6 bcdDevice; 


/* 厂商 编号 */ 
/* 产品 编号 */ 
/* 设备 出 厂 编号 */ 


_u8 


iManufacturer; 


/* 描述 厂商 字符 串 的 索引 */ 


ug rt 


/* 描述 产品 字符 串 





的 索引 */ 





.u8 iSerialNumber; 


.u8 bNumConfigurations; 





/* 描述 设备 序列 号 字符 串 的 索引 */ 
/* 可 能 





的 配置 数量 */ 


Jl Rm ote or qp UO 





— ((packed)); 


oie 
配置 描述 符 ， 此 配置 中 的 接口 数 、 支 持 的 挂 起 和 恢复 能 力 以 及 功率 要 求 。USB 配置 在 内 核 
中 使 用 usb host config 结构 体 描述 ，USB 配置 描述 符 定义 为 结构 体 usb_config descriptor, 


如 代码 清单 20.2 所 示 





































































































p2l 
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代码 清单 20.2 usb config descriptor £ 
SeruUct usbeoonmE ee erieer 
_u8 bLength; /* 描述 符 长 度 */ 
_u8 bDescriptorType; /* 描述 符 类 型 编号 */ 


结构 体 


/* 配置 所 返回 的 所 有 数据 的 大 小 */ 
_u8 bNumInterfaces; /* 配置 所 支持 的 接口 数 */ 

_u8 bConfigurationValue; /* Set Configuration 命令 需要 的 参数 值 */ 
9 _u8 iConfiguration; /* 描述 该 配置 的 字符 串 的 索引 值 */ 
10 _ u8 bmAttributes; /* 供电 模式 的 选择 */ 
i uB /* 设备 从 总 线 提取 的 最 才 
12 y tl (sese) 
e 接口 描述 符 : 接口 类 、 子 类 和 适用 的 协议 ， 接 口 备 | 
在 内 核 中 使 usb interface 结构 体 描 述 ，USB 接口 


usb_interface_descriptor， 如 代码 20.3 所 示 。 





_le16 wTotalLength; 

































































En 


bMaxPower; 























j 配 置 的 数目 和 端点 数目 。USB 接口 
述 符 定义 为 结构 体 















































































































































代码 清单 20.3 usb interface descriptor 结构 体 





























1 struct usb interface descriptor ( 

3 — WS orema; /* 描述 符 长 度 */ 

4 _ u8 bDescriptorType; /* 描述 符 类 型 */ 

5 

6 | u8 bInterfaceNumber; /* 接口 的 编号 */ 

7 . u8 bAlternateSetting; /* 备用 的 接口 描述 符 编号 */ 
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8 . u8 bNumEndpoints; /* 该 接口 使 用 的 端点 数 ， 不 包括 端点 0 */ 
9 . u8 bInterfaceClass; /* 接口 类 型 */ 
TO 

11 .  u8 bInterfaceProtocol; /* 接口 所 遵循 的 协议 */ 

12 __u8 iInterface; /* 描述 该 接口 的 字符 串 索 引 值 */ 

Te etoLee sD VAL ye 














€ 端点 描述 符 : 端点 地 址 、 方 向 和 类 型 ， 文 持 的 最 大 包 大 小 ， 如 果 是 中 断 类 型 的 端点 则 还 
包括 轮 询 频率 。 在 Linux 内 核 中 ，USB 端点 使 用 usb. host endpoint 结构 体 来 描述 ，USB 
端点 描述 符 定义 为 usb_endpoint_descriptor 结构 体 ， 如 代码 清单 20.4 所 示 。 











Mi 



















































































代码 清单 20.4 usb endpoint descriptor 结构 体 
























































1 struct usb endpoint descriptor ( 

3 . u8 bLength; /* 描述 符 长 度 */ 

4 _ u8 bDescriptorType; /* 描述 符 类 型 */ 

5 _ u8 bEndpointAddress; /* 端点 地 址 : 0 一 3 位 是 端点 号 ， 第 7 位 是 方向 (0-OUT,1-IN) */ 
6 ，  u8 bmAttributes; /* 端点 属性 : bit [0:1] 的 值 为 00 表示 控制 ， 为 01 表示 同步 ， 为 02 表示 批量 ， 为 03 Xe */ 
7 | | lel6 wMaxPacketSize; /* 本 端点 接收 或 发 送 的 最 大 信息 包 的 大 小 */ 

8 |  u8 bInterval; /* 轮 询 数据 传送 端点 的 时 间 间 隔 */ 

9 /* 对 于 批量 传送 的 端点 以 及 控制 传送 的 端点 ， 此 域 忽略 */ 

10 /* 对 于 同步 传送 的 端点 ， 此 域 必须 为 1 */ 

11 /* 对 于 中 断 传送 的 端点 ， 些 域 值 的 范围 为 1 一 255 */ 

t27 -u8 pRetresh; 

M u8 bSynchAddress; 

14 ) attribute _ ((packed)); 



































@ 字符 串 描述 符 : 在 其 他 描述 符 中 会 为 某 些 字段 提供 字符 串 索 引 ， 它 们 可 被 用 来 检索 描述 
性 字符 串 ， 可 以 以 多 种 语言 形式 提供 。 字 符 串 描述 符 是 可 选 的 ， 有 的 设备 有 ， 有 的 设备 
没有 ， 字 符 串 描述 符 对 应 于 usb string descriptor 结构 体 ， 如 代码 清单 20.5 所 示 。 























































































































代码 清单 20.5 usb string descriptor 结构 体 


Ser ruet SDESSE rI ov deS CLI pEr 

3 . u8 bLength; /* 描述 符 长 度 */ 

4 _ u8 bDescriptorType; /* 描述 符 类 型 */ 

5 

6 . .lel6 wData[1]; /* 以 UTF-16LE 编码 */ 
I i ateni bute packed) 














例如 ， 笔 者 在 PC 上 插入 一 个 SanDisk U 盘 后 ， 通 过 lsusb 命令 得 到 这 个 U 盘 相关 的 描述 符 ， 
从 中 可 以 显示 这 个 U 盘 包 含 了 一 个 设备 描述 符 、 一 个 配置 描述 符 、 一 个 接口 描述 符 以 及 批量 输入 
和 批量 输出 两 个 端点 描述 符 。 旺 现 出 来 的 信息 内 容 直 接 对 应 于 usb_device_descriptor、usb_config_ 
descriptor. usb interface descriptor. usb endpoint descriptor. usb string descriptor 结构 体 ， 如 下 


所 示 : 


Bus 001 Device 004: ID 0781:5151 SanDisk Corp. 
Device Descriptor: 





























































































































bLength 18 
bDescriptorType 1 

bcqUSB 200 
bDeviceClass 0 Interface 
bDeviceSubClass 0 
bDeviceProtocol 0 
bMaxPacketSizeO0 64 
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idVendor 0x0781 SanDisk Corp. 
XdProduoct 0x5151 
bcdDevice v0 
iManufacturer 1 SanDisk Corporation 
TProduct 2 Cruzer Micro 
iSerial 3 20060877500A1BElFDE1l 
bNumConfigurations 1l 
Configuration Descriptor: 
bLength 9 
bDescriptorType 2 
wTotalLength 32 
bNumInterfaces 1L 
bConfigurationValue 1 
iConfiguration 0 
bmAttributes 0x80 
MaxPower 200mA 
Interface Descriptor: 
bLength 9 
bDescriptorType 4 
bInterfaceNumber 
bAlternateSetting 
bNumEndpoints 2 
bInterfaceClass 8 Mass Storage 
bInterfaceSubClass G SCS 
bInterfaceProtocol 80 Bulk (Zip) 








ilnterface 0 
Endpoint Descriptor: 


bLength 7 
bDescriptorType 5 
bEndpointAddress (esed gmiee 3b TNI 
bmAttributes 2 
Transfer Type Bulk 
Synch Type none 
wMaxPacketSize 517 
bInterval 0 
Endpoint Descriptor: 
bLength E 
bDescriptorType 5 
bEndpointAddress 0x01 EP 1 OUT 
bmAttributes 2 
Transfer Type Bulk 
Synch Type none 
wMaxPacketSize 512 
bInterval JL 


Language IDs: (length-4) 
0409 English (US) 


2 USB 主机 控制 器 驱动 
20.2.1 USB 主机 控制 器 驱动 的 整体 结 


USB 主机 控制 器 有 3 种 规格 : OHCI (Open Host Controller Interface), UHCI (Universal Host 
Controller Interface) 和 EHCI (Enhanced Host Controller Interface). OHCI 驱动 程序 用 来 为 非 PC 系 
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统 上 以 及 带 有 SIS 和 ALi 芯片 组 的 PC 主板 上 的 USB 芯片 提供 支持 。UHCI 驱动 程序 多 用 来 为 大 | QQ 
多 数 其 他 PC 主板 (包括 Intel 和 Via) 上 的 USB 芯片 提供 支持 。EHCI 由 USB 2.0 规范 所 提出 ， 
它 兼容 于 OHCI 和 UHCI. UHCI 的 硬件 线路 比 OHCI 简单 ， 所 以 成 本 较 低 ,但 需要 较 复杂 的 驱动 
Bm CPU 负荷 稍 重 。 本 节 将 重点 介绍 人 其 入 式 系统 中 常用 的 OHCI 主机 控制 器 驱动 。 
， 主 机 控制 器 驱动 
Linux 内 核 中 ， 用 usb_hcd Cee USB 主机 控制 器 驱动 ， 它 包含 USB 主机 控制 器 的 
“家 务 ” 信 息 、 硬 件 资源 、 状 态 描述 和 用 于 操作 主机 控制 器 的 he. driver 等 ， 其 定义 如 代码 清单 20.6 
所 示 。 
代码 清单 20.6 usb hcd 结构 体 
Jb gre sel iex 
2 人 
3 * housekeeping 
4 my 
E struct usb bus self; [** duod es 9/ 
6 struct kref kref; 
7 
8 const char *oroduct desc; /* 产品 / 广 商 字符 串 */ 
9 char irq descr [24]; A ee de Jowie e v 
0 
l| grouet iner labens elm Ciner, /* 驱动 根 hub 的 polling */ 
2 struct urb *status urb; /* 目前 的 状态 urb */ 
3 #ifdef CONFIG PM 
4 struct work struct wakeup work; /* 用 于 远程 唤醒 */ 
5 #endif 
6 
7 73 
8  * 硬件 信息 /状态 
9 s 
20 const struct hc driver *driver; /* 硬件 特定 的 钩子 函数 */ 
21 
22  /* 需要 被 自动 操作 的 标志 */ 
23 unsigned long ie dex 
24 #define HCD FLAG HW ACCESSIBLE 0x00000001 
25 $define HCD FLAG SAW IRQ 0x00000002 
26 
27 unsigned rh registered:1;/* 根 Hub 已 被 注册 ? */ 
28 
29  /* 下 一 个 标志 的 采用 只 是 “权益 之 计 ”， 当 所 有 HCDs 支持 新 的 根 Hub 轮 询 机 制 后 将 移 除 */ 
d da uses new polling:1; 
32 unsigned poll rh:1; /* 轮 询 根 Hub 状态 ? */ 
33 unsigned poll pending:1; /* 状态 改变 了 吗 ? */ 
34 unsigned wireless:1;  /* JEA: USB HCD? */ 
35 unsigned authorized default:1; 
36 unsigned has tsip /* f nub SK T TT? */ 
Bi 
38 int irg; /* 分 配 的 中 断 号 */ 
39 void _iomem *regs; /* 设备 内 存 或 I/O */ 
40  u64 rsrc start; /* 内 存 或 I/0 资源 开始 位 置 */ 
41  u64 rsre len; /* 内 存 或 I/0 资源 大 小 */ 
42 unsigned power budget; /* in mA, 0 - no limit */ 
INUX S 
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43 
44 
45 
46 
47 
48 
49 
52 
S 
54 


Yy 
usb hcd 中 的 he driver ARIA EZ, "DENT RARE FIT RE EU SUSRBUSU T AR. Rog 


#define HCD BUFFER POOLS 4 


Struct dma pogr *pool [HCD BUFFER POOLS]; 


fire State; 


/* 主机 控制 器 驱动 的 私有 数据 */ 


unsigned long hcd priv[0] 





. attribute . ((aligned(sizeof (unsigned long)))); 















































义 如 代码 清单 20.7 所 示 。 


SO CR CR wei 





No MN PN 
NOS exon MOT 


BA vb hom INS: 
STR 


WHEN 
| 


B 0) C) C) CQ) CO C) CO CO 
C57 AO «709. 3 ON CUAL MS CGU" 




















代码 清单 20.7 hc driver 结构 体 


seruct Joke" driver q 


const char *description; /* "ehci-hcd" 等 */ 


e fy Yd 


const char *product desc; /* j^dh/] Hj */ 
size t hcd priv size; /* 私有 数据 的 大 小 */ 





/* 中 断 处 理 函 数 */ 


me nm ee (Se le ec 

















ani, ee 

#define HCD MEMORY 0x0001 /* HC 寄存 器 使 用 的 内 存 和 1/O */ 
#define HCD USB11 0x0010 Js 39S dL.dL vw 

#define HCD USB2 0x0020 25905 ROUES 














/* 被 调用 以 初始 化 HCD HB Hub */ 
ine reset) (ey eee usb hed rel 
anti*start) tsrruct nsb hed "ned 























/* Hit Hub 后 ， 进 入 D3 (etc) 前 被 i 2 
int(*pci suspend) (struct usb hcd *hcd, pm message t message); 


BÉ 





























/* 在 进入 D0 (etc) JE, WKE Hub 前 i */ 
int(*pci resume) (struct usb hcd *hcd); 


Es 























/* 使 HCD 停止 写 内 存 和 进行 1/0 操作 */ 
ES 


/* XH HCD */ 
word ctfshutdowH^ (Strtuct usb hod ee 














/* 返回 目前 的 帧 数 */ 
int(*get frame number) (struct usb hcd *hcd); 








/* EH I/O 请 求 和 设备 状态 */ 
int (*urb enqueue) (struct usb hcd *hcd, struct urb *urb, gfp t mem flags); 
int (*urb dequeue) (struct usb hcd *hcd, struct urb *urb, int status); 


/* 释放 endpoint 资源 */ 
void(*endpoint disable) (struct usb hcd *hcd, struct usb host endpoint *ep); 


/* 根 Hub 支持 */ 
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41 tme avig status dabard(etrüct u5b.hod *hod. char f59f)9 

42  int(*hub control) (struct usb hcd *hcd, ul16 typeReq, ul6 wValue, ul16 wIndex, 
43 char *buf, ul6 wLength); 

44 int(*bus suspend) (struct usb hcd*); 

45  int(*bus resume)istruct usb neck > 

46  int(*start port reset) (struct usb hcd *, unsigned port num); 

47 void (EE le poXenere)) (evra dels) level wi dune) 

48 iwe (*port handed over) (struct usb hcd *, int); 

49 Y; 

在 Linux 内 核 中 ， 使 用 如 下 函数 来 创建 HCD: 











struct usb hcd *usb create hcd (const struct hc driver *driver, 
struct device *dev, char *bus-name): 


如 下 函数 被 用 来 增加 和 移 除 HCD: 


int usb add hcd(struct usb hcd *hcd, 




















unsigned int irqnum, unsigned long irgflags); 
void usb remove hcd(struct usb hcd *hcd); 


第 34 行 的 urb_enqueue() 函 数 非 常 关键 , 实际 上 ， 上层 通过 usb submit urb()$e^7 1 个 USB 请 
求 后 ， 该 函数 调用 usb_hcd_submit_urb()， 并 最 终 调用 至 usb_hcd 的 driver 成 员 (hc. driver 类 型 ) 
的 urb_enqueue()。 这 里 可 以 先 建立 一 点 印象 ， 不 理解 没有 关系 ， 后 文 会 看 地 更 加 清楚 。 

2. OHCI 主机 控制 器 驱动 

OHCI HCD 驱动 属于 HCD 驱动 的 实例 ， 它 定义 了 一 个 ohci_hcd 结构 体 ， 作 为 代码 清单 20.6 
给 出 的 usb. hed 结构 体 的 私有 数据 ， 这 个 结构 体 的 定义 如 代码 清单 20.8 所 示 。 


代码 清单 20.8 ohci_hcd 结构 体 



















































































































































































SEruct onci NGA 4 
2 Suna eek se IGEk; 













































































4 /* 与 主机 控制 器 通信 的 IO 内 存 (DMA 一 致 ) */ 

5 struct ohci regs | iomem *regs; 

6 

7 /与 主机 控制 器 通信 的 主 存 (DMa 一 致 ) */ 

8 IE 

9 dma addr t hcca dma; 

0 

1 struct ed *ed rm list; /* 将 被 移 除 */ 

2 struct ed *ed bulktail; /* 批量 队列 尾 */ 

3 struct ed *ed controltail; /* 控制 队列 尾 */ 
4 struct ed *periodic[NUM INTS]; /* int table *EZT" */ 
5 

6  /* OTG 控制 器 和 收发 器 需要 软件 交互 ， 其 他 的 外 部 收发 器 应 该 是 软件 透明 的 */ 
7 struct otg transceiver *transceiver; 

G) oie Carane nm One he -Snel 
9 

20  /* 队列 数据 的 内 存 管理 */ 

uL struct dma pool *td cache; 

2D struct dma_pool *ed_cache; 

29. trer iol coms 

24 struct list head pending; 

25 

26  /* driver 状态 */ 

2 imie Mn op 
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28 int load[NUM INTS]; 

29 u32 hc control; /* 主机 控制 器 控制 寄存 器 的 复制 */ 
30 unsigned long next statechange; /* 挂 起 /恢复 */ 
31  u32 fminterval; /* 被 保存 的 寄存 器 */ 


32 unsigned autostop:1; 

















33 unsigned long flags; 


34 struct work struct nec work; 

B5 Stract timer- -list unlink watchdog; 
36 unsigned eds scheduled; 
37 struct ed *ed to check; 

38 unsigned zf delay; 

CONI 








使 用 如 下 内 联 函 数 可 实现 usb. hed 和 ohci_hcd 的 相互 转换 : 


Semace Oier Mee Haee ro onet (Ee Lu aie nee 
Struce usbehcdi ohc to hcd const struct Oe iN OH) 


从 usb hed 得 到 ohci hed 只 是 取得 “私有 ”数据 ， 而 从 ohci hed 得 到 usb hed 则 是 通过 
container_of() 从 结构 体 成 员 获 得 结构 体 指针 。 
使 用 如 下 函数 可 初始 化 OHCI 主机 控制 器 : 
tme Shack inmi: tecu: Gier neel Oner)? 
如 下 函数 分 别 用 于 开启 、 停 止 及 复位 OHCI 2: 


Tae Oaer ocon (nue Gaci neel Oneik 










































































voie Orel stoo (erruct vel eel Mechy 
void ohci usb reset (struct ohci hcd *ohci); 


OHCI 主机 控制 器 驱动 的 主机 工作 仍然 是 实现 代码 清单 20.7 给 出 的 hc_driver 结构 体 中 的 成 员 函 数 。 


20.2.2 ”实例 : S3C6410 USB 1.1 主机 驱动 
S3C6410 内 部 集成 了 2 个 USB 控制 器 ,1 个 是 USB 1.1 主机 控制 器 ,支持 低速 和 全 速 USB 
设备 ， 另 外 1 个 是 USB 2.0 支持 OTG 的 USB 控制 器 。 
S3C6410 的 USB1.1 主机 控制 器 驱动 由 drivers/usb/host/ohci-hcd.c〔 服 务 于 各 种 SoC 情况 下 
的 OHCI 主机 驱动 通用 部 分 ) 和 drivers/usb/host/ohci-s3c2410.c( 服 务 于 S3C2410、S3C64XX 和 
SSPCIXXO 文件 共同 完成 ， 前 者 通过 “#include "ohci-s3c2410.c"” 语 句 包含 了 后 者 ， 详 细 情 况 
如 下 : 


#if defined (CONFIG ARCH S3C2410) | |defined(CONFIG ARCH S3C64XX)|| defined (CONFIG_ARCH_S5PC1XX) 
dfinclude "ohci-s3c2410.c" 

#define PLATFORM DRIVER ohci hcd s3c2410 driver 

#endif 


drivers/usb/host/ohci-hcd.c 只 是 根据 定义 的 CPU 体系 结构 引用 对 应 的 platform. driver 并 注 
册 之 ， 对 于 S3C6410 为 ohci hed s3c2410 driver. 

S3C6410 USB1.1 主机 控制 器 驱动 的 hc driver 结构 体 中 的 大 多 数 成 员 函 数 都 是 通用 的 
ohci xxxO 函 数 ， 而 start(). hub status data(). hub controlO FA ZW] £F Xj S3C6410 而 编写 的 ， 
如 代码 清单 20.9 所 示 。 


代码 清单 20.9 S3C2410 主机 控制 器 驱动 的 hc_driver 结构 体 


cis cu be oon ee D eC Hoe eme Doe one el vA ET 



























































































































































































































































2 .description - hcd name, 
3 .product desc = "oaC24XX (QISKCULU 
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eoo 





















































4 Soe rs or(struct ome 
5 

6  /* 通用 硬件 联接 */ 
Ji .irq - ONECARE 

8 .flags = HCD USB11 | HCD MEMORY, /* USB 1.1 标准 ，hc 寄存 器 位 于 内 存 */ 
9 

0 /* 基本 的 生命 周期 操作 */ 

1 .start - ohci s3c2410 start, 

2 .Stop = ONCIESEOD 

3 

4 /* 管理 1/0 请 求 和 相关 的 设备 资源 */ 

5 .urb enqueue = ohci urb enqueue, 

6 .urb dequeue = ohci_urb dequeue, 

3 .endpoint disable - ohci endpoint disable, 
8 

9. J* WB */ 
20 .get_frame_number = ohci_get_frame, 
2A 


22  /* dg Hub 支持 */ 
23 .hub status data = 


o 


hci s3c2410 hub status data, 





24 .hub control - oher isse T0 Inqblo)- teXouan Ec oll» 
25 difdef CONFIG PM 

26 .bus_suspend = ohci bus suspend, 

27 .bus resume - ohci bus resume, 

28 #endif 

29 .Start port reset - Glacuuecus orte OTI NECS, 
EON 





























hc driver 的 start0 成 员 函 数 用 于 初始 化 OHCI 并 启动 主机 控制 器 ， 如 代码 





20.10 所 示 。 
































代码 清单 20.10 S3C6410 USB1.1 主机 控制 器 驱动 的 start() 函 数 





1 static int ohci s3c2410 start (struct usb hcd ee 

2 

3 Save ohnenehee Soner = NEC Eo- OMe ee 

4 de eo 

5 

6 if ((ret = ohci init(ohci)) < 0) /* 4k ohci hed */ 
y return reris 

8 

9 at ((ret = orei rum (hei) < 09 1 75" Ba css nesi 57 
0 err ("can't start $s", hcdoself.bus name); 

jl (ocn: oma bed) 

2 return ret; 

39) 

4 

nr yerum Qi 

$5 






































hc driver 的 hub control()/X ia ER 4t. ohci s3c2410_hub_control0 中 的 主体 是 调用 通用 的 ohei 
hub_control0 函 数 ，hub_status_data0) 成 员 函 数 ohci_s3c2410_hub_status_data() 的 主体 是 调 
ohci hub status data() EK Zr, 

LDD6410 开发 板 USB 1.1 主机 接口 原理 如 图 20.3, XF LDD6410 开发 板 而 言 ， 在 内 核 中 开 
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启 “OHCI HCD support”、“ USB Human Interface Device (full HID) support" 和 “USB Mass Storage 
support” 选 项 可 以 使 我 们 支持 USB 1.1 主机 、U 盘 以 及 HID 设备 。 








VDD 5V 
Q 









J3 





1 
USBDN R57 22R — R0402 2 viue 
USBBP SENN RO402] 3 


GND 





R61 
15K 15K 
R0402 


20.8 LDD6410 USB 1.1 主机 接口 原理 图 


UK 


插入 一 个 USB 鼠标 ， 控 制 台 会 打印 类 似 信息 : 

usb 11: configuration £1 chosen from 1 choice input: USB Mouse as /class/input/input2 
genericusb 0003:1267:0201.0001: input: USB HID v1.00 Mouse [USB Mouse] on usb 
s3c24xxl/input0 


拔 出 USB 鼠标 后 ， 控 制 台 打 印 : 

usb 11: USB disconnect, address 2 

插入 一 个 U 盘 ， 控 制 台 会 打印 类 似 信息 : 

usb 11: new full speed USB device using s3c2410ohci and address 4 


























usb 11: configuration £41 chosen from 1 choice 























scsi0 : SCSI emulation for USB Mass Storage devices 

H scsi 0:0:0:0: DirectAccess Lenovo USB Flash Drive 1100 PQ: O0 ANSI: O0 CCS 

sd 0:0:0:0: [sda] 7831552 512byte hardware sectors: (4.00 GB/3.73 GiB) 

sud D:OPsDED: pedal] mires Protect xs ors 

Sd 0:0:0:0: [sda] Assuming drive cache: write through 

sd 0:0:0:0: [sda] 7831552 512byte hardware sectors: (4.00 GB/3.73 GiB) 

sd 0:0:0:0: Isda] Write Protect is off 

sd 0:0:0:0: [sda] Assuming drive cache: write through sda: sdal 

Sd 0:0:0:0: [sda] Attached SCSI removable disk sd 0:0:0:0: Attached scsi generic so 
type 0 

通过 mount 命令 来 挂 载 这 个 U 盘 : 

mount /dev/sdal t vfat /mnt 


20.3 USB 设备 驱动 


20.3.1 USB 设备 驱动 整体 结 
里 所 说 的 USB 设备 驱动 指 的 是 从 主机 角度 观察 , 怎样 访问 被 插入 的 USB 设备 , 而 不 是 























这 
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指 USB 设备 内 部 本 身 运 行 的 固件 程序 。Linux 系统 实现 了 几 类 通用 的 USB 设备 驱动 (也 称 客户 
驱动 )， 划 分 为 如 下 几 个 设备 类 。 

e 音频 设备 类 。 
通信 设备 类 。 
HID 〈 人 机 接口 ) 设备 类 。 
显示 设备 类 。 
海量 存储 设备 类 。 
电源 设备 类 。 
打印 设备 类 。 
集线器 设备 类 。 
般 的 通用 的 Linux 设备 Can U Zt. USB 鼠标 、USB 键盘 等 ) 都 不 需要 工程 师 再 编写 驱 

乡 



















































































































































































动 ， 需 要 编写 的 是 特定 厂商 、 特 定 芯片 的 驱动 ， 而 且 往往 也 可 以 参考 内 核 中 已 提供 的 驱动 的 
模板 。 
Linux 内 核 为 各 类 USB 设备 分 配 了 相应 的 设备 号 ， 如 ACM USB 调制 解 调 器 的 主 设备 号 为 166〈 默 




















认 设 备 名 /dewttyACMn)、USB 打印 机 的 主 设备 号 为 180， 次 设备 号 为 0 一 15 〈 默 认 设备 名 /dewlpn)、 
USB 串口 的 主 设备 号 为 188. 〈 默 认 设备 名 /dewttyUSBn) 等 ， 详 见 http://www.lanana.org/ 网 站 的 设备 
列表 。 

内 核 中 提供 了 USB 设备 文件 系统 Cusbdevfs, Linux 2.6 KX usbfs, BI USB 文件 系统 )， 它 和 /proc 
类 似 ， 都 是 动态 产生 的 。 通 过 在 /etc/fstab 文件 中 添加 如 下 一 行 : 

none /proc/bus/usb usbfs defaults 

或 者 输入 命令 : 

mount -t usbfs none /proc/bus/usb 


可 以 实现 USB 设备 文件 系统 的 挂 载 。 





























































































































个 典型 的 /proc/bus/usb/devices 文件 的 结构 如 下 (笔者 在 PC 上 插入 了 一 个 SanDisk U 盘 ): 
T: Bus=01 Lev=00 Prnt=00 Port=00 Cnt=00 Dev#= 1 Spd-12 MxCh= 2 
B: Alloc- 0/900 us ( 0$), 4$Int- O0, £Iso- O0 
D: Ver- 1.10 Cls-09(hub ) Sub-00 Prot-00 MxPS-64 #Cfgs= 
P: Vendor-0000 ProdID-0000 Rev- 2.06 
Sc HManutacturer-bDinux 2.6.15,5 uhed-hed 
$: Product-UHCI Host Controller 
S: SerialNumber-0000:00:07.2 
C:* #Ifs= 1 Cfg#= 1 Atr-cO0 MxPwr- 0mA 
I: If#= 0 Alt- 0 4EPs- 1 Cls-09(hub ) Sub=00 Prot-00 Driver-hub 
E: Ad=81 (I) Atr-03(Int.) MxPS- 2 Ivl-255ms 
T: Bus-01 Lev-01 Prnt-01 Port-00 Cnt=01 Dev#= 2 Spd-12 MxCh- 0 
D: Ver= 2.00 Cls-00(»ifc ) Sub=00 Prot-00 MxPS-64 #Cfgs= 1 
P: Vendor-0781 ProdID-5151 Rev- 0.10 
$: Manufacturer-SanDisk Corporation 
SS Product-Ceruzer Micro 
S: SerialNumber-20060877500A1BElFDE1 
C:* #Ifs= 1 Cfg#= 1 Atr-80 MxPwr-200mA 
I: If#= 0 Alt- 0 #EPs= 2 Cls-08(stor.) Sub-06 Prot-50 Driver- (none) 
E: Ad=81 (I) Atr=02 (Bulk) MxPS- 512 Ivl-0ms 
E: Ad=01 (0O) Atr-02(Bulk) MxPS- 512 Ivl-0ms 
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通过 分 析 usbfs 中 记录 的 信息 ， 可 以 得 到 系统 中 USB 完整 的 信息 ， 例 如 ，usbview 可 以 以 图 





















































形 化 的 方式 显示 系统 中 的 USB 设备 。 











` 














当然 ， 在 编译 Linux 内 核 时 ， 应 该 包括 “USB device filesystem". usbfs 动态 跟踪 总 线 









































上 插入 和 移 除 的 设备 ， 通 过 它 可 以 查看 系统 中 USB 设备 的 信息 ， 包 括 拓扑 、 带 宽 、 设 备 描 



































述 符 信 


此 外 ， 在 sysfs 文件 系统 中 ， 




















县 、 产 品 ID、 字 符 串 描述 符 、 配 置 描述 符 、 接 口 描述 符 、 端 点 描述 符 等 。 
样 包含 了 USB 相关 信息 的 描述 ， 但 只 限于 接口 级 别 。USB 设 










































































pi 


























4 fll USB 接口 在 sysfs 中 均 表 示 为 单独 的 USB 设备 ， 其 目录 命名 规则 如 下 : 


根 集线器 -集线器 端口 号 -集线器 端口 号 -.. .) :配置 . 接 


















































































































































J 
下 面 讲 解 /sys/bus/usb 目录 的 树 形 结构 实例 ， 其 中 的 多 数 文件 都 是 到 /sys/devices 及 /sys/drivers 
中 相应 文件 的 链接 。 
usb 
|-- devices 
| secperilo(Qos fo 4r fl dewlcespck0DDDIOD/ADDODSODIOJ ou Sm U-:120 
| i ll > Sr od ole en) 3 (ONONON O30 07 2 
| | 
| '-- usbl = ../../../devices/pci0000:00/0000:00:07.2/usb1 
'-- drivers 
ze pup 
m ceps Ts ce ecu ei a e ee Ea CNTA TNNT O00 0 2 /a O00 
— oie] 
e ME = ss cd cod aed) MN Le me 
E unum 
二 
co did 2504507 do 6 a 8k eNO) &(0(9)/ 0000) (00): (Q7) 2 vasdoyll To E 
—c onel 
cc molle — 5654 5 o4 acd! ono I nS 
1 o8nbind 
Uc qslodh —— c4 col oc, oci Gesialecexs [exe 0010106 (0X0,/70101010) (00) (0) 0] sl 
misistis 
[== ormel 
| 
Vc quale) el 
正如 tty driver. i2c driver 等 ， 在 Linux 内 核 中 ， 使 用 usb driver 结构 体 描述 一 个 USB 设备 



























































驱动 ，usb_driver 结构 体 的 定义 如 代码 清单 20.11 所 示 。 


XO. 00^ «JO CO ai 65 NO CES 


ererererrr rr 
OR des 499 B (qp e» 


代码 清单 20.11 usb driver 结构 体 


utere us HC MT 
const char *name; /* 驱动 名 称 */ 
int (*probe) (struct usb interface *intf, 
const struct usb device id *id); /* 探 测 函 数 */ 
void (*disconnect) (struct usb interface *intf); /* 断 开 函 数 */ 
int (*ioctl) (struct usb interface *intf, unsigned int code, 
void *buf); /* 1/0 控制 函数 */ 
int (*suspend) (struct usb interface *intf, pm message t message); /*fi 
int (*resume) (struct usb interface *intf); /* VOZEN */ 
int (*reset resume) (struct usb interface *intf); 
void (*pre reset) (struct usb interface *intf); 
void (*post reset) (struct usb interface *intf); 
const struct usb device id *id table;/* usb device id 表 指 针 */ 
struct usb dynids dynids; 

















nr 


起 函数 */ 


Struct usbdrv wrap drvwrap; 
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l6. onsigned int no dynamiccid:l: 


oo 


17 unsigned int supports autosuspend:1; 
18 unsigned int soft unbind:1; 
dos 


在 编写 新 的 USB 设备 驱动 时 ， 主 要 应 该 完成 的 工作 是 probe) ll disconnect() PE 2, — BER ERI 
断 开 函数 ， 它 们 分 别 在 设备 被 插入 和 拔 出 的 时 候 被 调用 ， 用 于 初始 化 和 释放 软 硬 件 资源 。 对 
usb driver 的 注册 和 注销 通过 这 两 个 函数 完成 : 


int usb register(struct usb driver *new driver) 



















































































void usb deregister(struct usb driver *driver); 

usb driver 结构 体 中 的 id. table 成 员 描述 了 这 个 USB 驱动 所 支持 的 USB 设备 列表 ， 它 指向 一 
个 usb_device id 数组 ，usb_device id 结构 体 用 于 包含 USB 设备 的 制造 商 ID、 产 品 ID、 产 品 版 本 、 
设备 类 、 接 口 类 等 信息 及 其 要 匹配 标志 成 员 match_flags (标明 要 与 哪些 成 员 匹 配 ， 包 含 DEV_LO、 
DEV HI, DEV CLASS, DEV_SUBCLASS、 DEV PROTOCOL, INT CLASS, INT SUBCLASS, 
INT_PROTOCOL)。 可 以 借助 下 面 一 组 宏 来 生成 usb_device id 结构 体 的 实例 : 

USB_DEVICE (vendor, product) 

该 宏 根 据 制 造 商 ID 和 产品 ID 生成 一 个 usb device id 结构 体 的 实例 ， 在 数组 中 增加 该 元 素 将 
意味 着 该 驱动 可 支持 匹配 制造 商 ID、 产 品 ID 的 设备 。 

USB.DEVICE VER(vendor, product, lo, hi) 

该 宏 根 据 制造 商 中、 产品 一、 产品 版 本 的 最 小 值 和 最 大 值 生成 一 个 usb_device id 结构 体 的 实例 ， 
在 数组 中 增加 该 元 素 将 意味 着 该 驱动 可 支持 匹配 制造 商 ID、 产 品 ID 和 1lo~hi 范围 内 版 本 的 设备 。 

USB DEVICE INFO(class, subclass, protocol) 

该 宏 用 于 创建 一 个 匹配 设备 指定 类 型 的 usb device id 结构 体 实例 。 

USB INTERFACE INFO(class, subclass, protocol) 

该 宏 用 于 创建 一 个 匹配 接口 指定 类 型 的 usb. device id 结构 体 实例 。 

代码 清单 20.12 所 示 为 两 个 用 于 描述 某 USB. 驱动 所 支持 的 USB 设备 的 usb. device id 结构 体 












































































































































































































































数组 实例 。 
代码 清单 20.12 usb device id 结构 体 数 组 实例 
1 /* 本 驱动 支持 的 USB 设备 列表 */ 
2 
3 /* 实例 1 */ 
4 static struct usb device id id table [] - ( 
5 TIUS ESSE VATER VIENTO ESTIS FRODUCT ID) iF} 
6 CN 
D 
8 MODULE DEVICE TABLE (usb, id table); 
9 


10 /* 实例 2 */ 
1l static struct usb device Jd id table [] — 41 
12 ( .idVendor - 0x10D2, .match flags - USB DEVICE ID MATCH VENDOR, j, 


15 MODULE DEVICE TABLE (usb, id table); 

当 USB 核心 检测 到 某 个 设备 的 属性 和 某 个 驱动 程序 的 usb_device_id 结构 体 所 携带 的 信息 
致 时 ， 这 个 驱动 程序 的 probeO 函 数 就 被 执行 。 拨 掉 设 备 或 者 卸 掉 驱动 模块 后 ，USB 核心 就 执行 
disconnectO 函 数 来 响应 这 个 动作 。 
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EX usb. driver 结构 体 中 的 函数 是 USB 设备 驱动 中 USB 相关 的 部 分 , 而 USB 只 是 一 个 总 线 , 真正 
的 USB 设备 驱动 的 主体 工作 仍然 是 USB 设备 本 身 所 属 类 型 的 驱动 ， 如 字符 设备 、tty 设备 、 块 设备 、 
输入 设备 等 。 因此 USB 设备 驱动 包含 其 作为 总 线 上 挂 在 设备 的 驱动 和 本 身 所 属 设备 类 型 的 驱动 两 部 分 。 

与 platform driver 类 似 ，usb_driver 起 到 了 “牵线 ”的 作用 ， 即 在 probeO 里 注册 相应 的 字符 、 
tty 等 设备 ， 在 disconnectO 注 销 相 应 的 字符 、tty 等 设备 ， 而 原先 对 设备 的 注册 和 注销 一 般 直 接 发 
生 在 模块 加 载 和 仓 载 函数 中 。 

尽管 USB 本 身 所 属 设备 驱动 的 结构 与 其 不 挂 在 USB 总 线 上 时 完全 相同 ， 但 是 在 访问 方式 上 
却 发 生 了 很 大 的 变化 ， 例 如 ， 对 于 USB 接口 的 字符 设备 而 言 ， 尽 管 仍然 是 write(). read(). ioctl() 
这 些 函 数 ， 但 是 在 这 些 函 数 中 ， 贯 穿 始终 的 是 称 为 URB 的 USB 请 求 块 。 

如 图 20.4 所 示 ， 在 这 棵 树 里 ， 我 们 把 树 根 比 作 主机 控制 器 ， 树 叶 比 作 上 县 体 的 USB 设备 ， 树 
干 和 树枝 就 是 USB 总 线 。 树 叶 本 身 与 树枝 通过 usb_driver 连接 ， 而 树叶 本 身 的 驱动 〈 读 写 、 控 制 ) 
则 需要 通过 其 树叶 设备 本 身 所 属 类 设备 驱动 来 完成 。 树 根 和 树叶 之 间 的 “通信 ”依靠 在 树干 和 树 
枝 里 “ 流 消 ” 的 URB 来 完成 。 













































































































































































































































usb_driver 


本 身 设备 驱动 


20.4 USB 设备 驱动 结构 


























此 可 见 ，usb_driver 本 身 只 是 起 到 了 找到 USB 设备 、 管 理 USB 设备 连接 和 断 开 的 作用 ， 也 
就 是 说 ， 它 是 公司 入 口 处 的 “打卡 机 ”， 可 以 获得 员工 〈USB 设备) 的 上 /下 班 情况 。 树 叶 和 员工 
一 样 ， 可 以 是 研发 工程 师 也 可 以 是 销售 工程 师 ， 而 作为 USB 设备 的 树叶 可 以 是 字符 树叶 、 网 络 树 
叶 或 块 树 叶 ， 因 此 必须 实现 相应 设备 类 的 驱动 。 
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20.3.2 USB 请 求 块 ( URB ) 


1. urb 结构 体 
USB 请 求 块 (USB request block, urb) 是 USB 设备 驱动 中 用 来 描述 与 USB 设备 通信 所 用 的 
本 载体 和 核心 数据 结构 ， 非 常 类 似 于 网 络 设备 驱 动 中 的 sk. buff 结构 体 。 


代码 清单 20.13 urb 结构 体 
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EEC ET 
/* 私有 的 : 只 能 由 USB 核心 和 主机 控制 器 访问 的 字段 */ 
struct kref kref; /*urb 引用 计数 */ 
void *hcpriv; /* 主机 控制 器 私有 数据 */ 
atomic t use count; /* 并 发 传输 计数 */ 
u8 reject; /* 传输 将 失败 */ 
int unlink; /* unlink 错误 码 */ 
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/* 公共 的 : 可 以 被 驱动 使 用 的 字段 */ 

struct list head urb list; /* 链表 头 */ 

strucb usb anchor *Ahnchors 

struct usb device *dev; /* 关联 的 USB 设备 */ 

struct usb host endpoint *ep; 

unsigned int pipe; /* fuif */ 

int status; /* URB 的 当前 状态 */ 

unsigned int transfer flags; /* URB SHORT NOT OK | ...*/ 
void *transfer buffer; /* 发 送 数据 到 设备 或 从 设备 接收 数据 的 缓冲 区 */ 
dma addr t transfer dma; /* 用 来 以 DMA 方式 向 设备 传输 数据 的 缓冲 区 */ 
int transfer buffer length;/*transfer buffer Bk transfer dma 指向 缓冲 区 的 大 小 */ 


Ls + et UR abs OO NA ERI 
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int actual length; /* URB 结束 后 ， 发 送 或 接收 数据 的 实际 长 度 */ 
unsigned char *setup packet; /* 指向 控制 URB 的 设置 数据 包 的 指针 */ 
dma addr t setup dma; /* 控 制 URB 的 设置 数据 包 的 DMA 缓冲 区 */ 
start frame; /* 等 时 传输 中 用 于 设置 或 返回 初始 帧 */ 
number of packets; /* 等 时 传输 中 等 时 缓冲 区 数量 */ 

int interval; /* URB 被 轮 询 到 的 时 间 间 隔 《〈 对 中 断 和 等 时 urb 有 效 ) */ 
27 int error count; /* 等 时 传输 错误 数量 */ 
28 void *context; /* completion 函数 上 下 文 */ 
29 usb complete t complete; /* 当 URB 被 完全 传输 或 发 生 错误 时 ， 被 调用 */ 
30 /* 单 个 URB 一 次 可 定义 多 个 等 时 传输 时 ， 描 述 各 个 等 时 传输 */ 


E struct usb iso packet descriptor iso frame desc[0]; 
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32 }; 

2. urb 处 理 流 程 

USB 设备 中 的 每 个 端点 都 处 理 一 个 urb 队列 ， 在 队列 被 清空 之 前 ， 一 个 urb 的 典型 生命 周期 
如 下 。 





(1) 被 一 个 USB 设备 驱动 创建 。 

创建 urb 结构 体 的 函数 为 : 

struct urb *usb alloc urb(int iso packets, int mem flags); 

iso packets 是 这 个 urb 应 当 包含 的 等 时 数据 包 的 数目 ， 若 为 0 表示 不 创建 等 时 数据 包 。 
mem flags 参数 是 分 配 内 存 的 标志 ， 和 kmallocO 函 数 的 分 配 标志 参数 含义 相同 。 如 果 分 配 成 功 ， 
该 函数 返回 一 个 urb 结构 体 指 针 ， 和 否则 返回 0。 

urb 结构 体 在 驱动 中 不 能 静态 创建 ， 因 为 这 可 能 破坏 USB 核心 给 urb 使 用 的 引用 计数 方法 。 
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usb alloc urb] “RAO N: 

void usb free urb(struct urb *urb); 

该 函数 用 于 释放 由 usb_alloc_urb0 分 配 的 urb 结构 体 。 

(20 初始 化 ， 被 安排 给 一 个 特定 USB 设备 的 特定 端点 。 

对 于 中 断 urb， 使 用 usb fill int_urb() 函 数 来 初始 化 urb， 如 下 所 示 : 


void uso Gril ine a orb “mdo, Strüct Vao device Gey, 















































unsigned int pipe, void *transfer buffer, 
int buffer length, usb complete t complete, 
void "context, int interval): 


urb 参数 指向 要 被 初始 化 的 urb 的 指针 ; dev 指向 这 个 urb 要 被 发 送 到 的 USB 设备 ; pipe 是 这 
个 urb 要 被 发 送 到 的 USB 设备 的 特定 端点 ; transfer_ buffer 是 指向 发 送 数 据 或 接收 数据 的 缓冲 区 
的 指针 ， 和 urb 一 样 ， 它 也 不 能 是 静态 缓冲 区 ， 必 须 使 用 kmalloc()2K 2? B6; buffer length. 是 
transfer_buffer 指针 所 指向 缓冲 区 的 大 小 ; complete 指针 指向 当 这 个 urb 完成 时 被 调用 的 完成 处 理 
函数 ; context 是 完成 处 理 函 数 的 “上 下 文 ” interval 是 这 个 urb 应 当 被 调度 的 间隔 。 
上 述 函 数 参数 中 的 pipe 使 用 usb_sndintpipeO 或 usb. rcvintpipe 8 & 
对 于 批量 urb， 使 用 usb fill bulk_urb0) 函 数 来 初始 化 urb， 如 下 所 示 : 


vorei sl riii et urb *urb, struct usb-device *dev, 
























































































































































unsigned int pipe, void *transfer buffer, 
int buffer length, usb complete t complete, 
void *context); 


除了 没有 对 应 于 调度 间隔 的 interval 参数 以 外 ， 该 函数 的 参数 和 usb. fill int urb) EG CS] 
含义 相同 。 
上 述 函 数 参数 中 的 pipe 使 用 usb_sndbulkpipe0 或 者 usb_rcvbulkpipeO 函 数 来 创建 。 
对 于 控制 urb， 使 用 usb fill control urbO 函 数 来 初始 化 urb， 如 下 所 示 : 


voulu usbotillccontrol' urb(struüct urb "urb, struet usbodevrce *dev, 















































unsigned int pipe, unsigned char *setup packet, 
void *transfer buffer, int buffer length, 
usb complete t complete, void *context); 


除了 增加 了 新 的 setup packet 参数 以 外 ， 该 函数 的 参数 和 usb fill bulk urb() PAZ] ZU X 
相同 。setup_packet 参数 指向 即将 被 发 送 到 端点 的 设置 数据 包 。 
上 述 函 数 参数 中 的 pipe 使 用 usb. sndctrlpipe) Ek usb. rcvictrlpipe K 2S 5 61] E 
等 时 urb 没有 像 中 断 、 控 制 和 批量 urb 的 初始 化 函数 ， 我 们 只 能 手动 地 初始 化 urb， 而 后 才能 提交 
给 USB 核心 .代码 清 单 20.14 给 出 了 初始 化 等 时 urb 的 例子 , 它 来 自 drivers/usb/media/usbvideo.c 文件 。 


代码 清单 20.14 ”初始 化 等 时 urb 
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iL Exe. (an = (ue ct o USBVIDEO JNIUNSISJUITO abro) di 

2 NE o ET 

3 struct urb *urb = uvdosbuf[i].urb; 

4 urb-dev = dev; 

5 urbocontext = uvd; 

6 urb-pipe = usb rcvisocpipe (dev, uvd-—video endp);/* 端 口 */ 
7 urbointerval = 1; 

8 urb-*transfer flags = URB ISO ASAP; /*urb 被 调度 */ 

9  urb-transfer buffer = uvd>sbuf[i] .data;/* 传 输 buffer*/ 
10  urb-complete = usbvideo IsocIrq; /* 完成 函数 */ 

i urb-number of packets = FRAMES PER DESC; /*urb 中 的 等 时 传输 数量 */ 
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112 urbotransfer buffer length - uvdoiso packet len *FRAMES PER DESC; 
1.3 for (j2» k2»0; j « FRAMES PER DESC; j**, k *- uvdoiso packet len) ( 


oo 


14 urboiso frame desc[j].offset = k; 

13) urboiso frame desc[j].length = uvd-oiso packet len; 
16 } 

Rt 





(3) 被 USB 设备 驱动 提交 给 USB 核心 。 
在 完成 第 (1)、(2) 步 的 创建 和 初始 化 urb 后 ，urb 便 可 以 提交 给 USB 核心 ， 通 过 usb submit urb() 
函数 来 完成 ， 如 下 所 示 ; 
int usb submit urb(struct urb *urb, int mem flags); 
urb 参数 是 指向 urb 的 指针 ，mem_flags 参数 与 传递 给 kmalloc() 函 数 参数 的 意义 相同 ， 它 用 于 
告知 USB 核心 如 何在 此 时 分 配 内 存 缓冲 区 。 
在 提交 urb 到 USB 核心 后 ， 直 到 完成 函数 被 调用 之 前 ， 不 要 访问 urb. 中 的 任何 成 员 。 
usb submit urb0O 在 原子 上 下 文 和 进程 上 下 文中 都 可 以 被 调用 ，mem_flags 变量 需 根据 调 用 环 
境 进 行 相应 的 设置 ， 如 下 所 示 。 
€ GFP ATOMIC: 在 中 断 处 理 函 数 、 底 半 部 、tasklet、 定 时 器 处 理 函 数 以 及 urb 完成 函数 
中 ， 在 调用 者 持 有 自 旋 锁 或 者 读 写 锁 时 以 及 当 驱 动 将 current 一 state 修改 为 非 TASK - 
RUNNING 时 ， 应 使 用 此 标志 。 
GFP NOIO: 在 存储 设备 的 块 VO 和 错误 处 理 路 径 中 ， 应 使 用 此 标志 ; 
© GFP KERNEL: 如 果 没 有 任何 理由 使 用 GFP_ATOMIC 和 GFP NOIO， 就 使 用 GFP_ 







































































































































































































































































































































































KERNEL. 
如 果 usb submit urbO 调 用 成 功 ， 即 urb 的 控制 权 被 移交 给 USB 核心 ， 该 函数 返回 0， 否 则 ， 
返回 错误 号 。 








(4) 提交 由 USB 核心 指定 的 USB 主机 控制 器 驱动 。 
(5) 被 USB 主机 控制 器 处 理 ， 进 行 一 次 到 USB 设备 的 传送 。 
第 (4) — C55 步 由 USB 核心 和 主机 控制 器 完成 ， 不 受 USB 设备 驱动 的 控制 。 
(6) 当 urb 完成 ，USB 主机 控制 器 驱动 通知 USB. 设备 驱动 。 
在 如 下 3 种 情况 下 ，urb 将 结束 ，urb 完成 函数 将 被 调用 。 
€ urb 被 成 功 发 送 给 设备 ， 并 且 设 备 返回 正确 的 确认 。 如 果 urb— status 为 0, 意味 着 对 于 
个 输出 urb， 数 据 被 成 功 发 送 ， 对 于 一 个 输入 urp， 请 求 的 数据 被 成 功 收 到 。 
e 如果 发 送 数据 到 设备 或 从 设备 接收 数据 时 发 生 了 错误 ，urb 一 status 将 记录 错误 值 。 
€ urb 被 从 USB 核心 “去 除 连接 ” 这 发 生 在 驱动 通过 usb_unlink_urb0 或 usb kill urb() 
函数 取消 urb, Bk urb 虽 已 提交 ， 而 USB 设备 被 拔 出 的 情况 下 。 
usb unlink urb()fll usb_kill_urbO 这 两 个 函数 用 于 取消 已 提交 的 urb， 其 参数 为 要 被 取消 的 urb 
指针 。 对 usb_unlink_urb0 而 言 ， 如 果 urb 结构 体 中 的 URB_ASYNC_UNLINK 即 异步 unlink) 的 
标志 被 置 位 ， 则 对 该 urb 的 usb_unlink_urb0 调 用 将 立即 返回 ， 具 体 的 unlink 动作 将 在 后 台 进 行 。 
否则 ， 此 函数 一 直 等 到 urb 被 解 开 链接 或 结束 时 才 返 回 。usb_kill_urb0 会 彻底 终止 urb 的 生命 周 
期 ， 它 通常 在 设备 的 disconnectO 函 数 中 被 调用 。 
当 urb 生命 结束 时 (处 理 完成 或 被 解除 链接 ), 通过 urb 结构 体 的 status 成 员 可 以 获知 其 原因 ， 
如 0 表示 传输 成 功 ，-ENOENT 表示 被 usb_kill_urb() 杀 死 ，-ECONNRESET 表示 被 usb_unlink_urb0) 
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杀 死 ，-EPROTO 表示 传输 中 发 生 了 bitstuff 错误 或 者 硬件 未 能 及 时 收 到 响应 数据 包 ，-ENODEV 
表示 USB 设备 已 被 移 除 ，-EXDEYV 表示 等 时 传输 仅 完成 了 一 部 分 等 。 

对 以 上 urb 的 处 理 步 骤 进 行 一 个 总 结 ， 图 20.5 给 出 了 一 个 urb 的 整个 处 理 流程 ， 虚 线 框 的 
非 一 定 会 发 生 , 它 只 是 在 urb 正在 被 USB 核心 和 主机 控制 器 处 

























































































usb unlink urbO) 和 usb kill urb() 
时 ， 被 驱动 程序 取消 的 情况 下 才 发 生 。 


usb alloc urb() 








TH 






































HT: usb fill int urb() 
批量 : usb fill bulk urb() 


控制 : usb fill control urb() 
等 时 : 手工 初始 化 iso urb 








usb submit urb() 


| usb kill urb() | 
K usb unlink urb() 


























usb 核 心 、usb 主 机 控 





urb->complete() 


20.5 urb 处 理 流 程 











3. 简单 的 批量 与 控制 URB 

有 时 USB 驱动 程序 只 是 从 USB 设备 上 接收 或 向 USB 设备 发 送 一 些 简 单 的 数据 ， 这 时 候 ， 没 有 必 
要 将 urb 创建 、 初 始 化 、 提 交 、 完 成 处 理 的 整个 流程 走 一 遍 ， 而 可 以 使 用 两 个 更 简单 的 函数 ， 如 下 所 示 。 
C12 usb bulk msg(). 
usb bulk msgOR ŽEJE —- USB 批量 urb. 并 将 它 发 送 到 特定 设备 ， 这 个 函数 是 同步 的 ， 它 


一 直 等 待 urb 完成 后 才 返 回 。usb_bulk_msgO 函 数 的 原型 为 


unsigned int pipe, 











































































































int usb bulk msg(struct usb device *usb dev, 
void *data, int len, int *actual length, 








int timeout); 
usb dev 参数 为 批量 消息 要 发 送 的 USB 设备 的 指针 ，Ppipe 为 批量 消息 要 发 送 到 的 USB. 设备 的 


端点 ，data 参数 为 指向 要 发 送 或 接收 的 数据 缓冲 区 的 指针 ，len 参数 为 data 参数 所 指向 的 缓冲 区 
实际 发 送 或 接收 的 字 节 数 ，timeout 是 发 送 超 时 ， 以 jiffies 为 单位 ， 




































































的 长 度 ，actual_length 用 于 返回 
0 意味 着 永远 等 待 。 
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如 果 函 数 调用 成 功 ， 返 回 0; 和 否则， 返回 1 个 负 的 错误 值 。 

(2) usb control msgO 函 数 。 

usb control msg()FÁ Zi 5; usb bulk msg0O 函 数 类 似 ， 不 过 它 提供 驱动 发 送 和 结束 USB 控制 信 
息 而 非 批量 信息 的 能 力 ， 该 函数 的 原型 为 : 


int usb control msg(struct usb device *dev, unsigned int pipe, __u8 request, 
























































..u8 requesttype, _ ul6 value, | ul6 index, void *data, . ul6 size, int timeout); 

dev 指向 控制 消息 发 往 的 USB 设备 ，pipe 是 控制 消息 要 发 往 的 USB 设备 的 端点 ，request 是 
这 个 控制 消息 的 USB 请 求 值 ，requesttype 是 这 个 控制 消息 的 USB 请 求 类 型 ，value 是 这 个 控制 消 
息 的 USB 消息 值 ，index 是 这 个 控制 消息 的 USB 消息 索引 值 ，data 指向 要 发 送 或 接收 的 数据 缓冲 
X, size 是 data 参数 所 指向 的 缓冲 区 的 大 小 ，timeout 是 发 送 超时 ， 以 jiffies 为 单位 ，0 意味 着 永 
远 等 待 。 

参数 request. requesttype. value 和 index 与 USB 规范 中 定义 的 USB 控制 消息 直接 对 应 。 

如 果 函 数 调用 成 功 ， 该 函数 返回 发 送 到 设备 或 从 设备 接收 到 的 字 节 数 ， 否 则 ， 返 回 一 个 负 的 
错误 值 。 

对 usb bulk msg()fll usb control msg() 函 数 的 使 用 要 特别 慎重 ， 由 于 它们 是 同步 的 ， 因 此 不 
能 在 中 断 上 下 文 和 持 有 自 旋 锁 的 情况 下 使 用 。 而 且 ， 该 函数 也 不 能 被 任何 其 他 函数 取消 ， 因 此 ， 
务必 要 使 得 驱动 程序 的 disconnect() 函 数 掌握 足够 的 信息 ， 以 判断 和 等 待 该 调用 的 结束 。 


20.3.8 FRIU AI EFF ES 2t 
在 USB 设备 驱动 usb_driver 结构 体 的 探测 函数 中 ， 应 该 完成 如 下 工作 。 
e 探测 设备 的 端点 地 址 、 组 冲 区 大 小 ， 初 始 化 任何 可 能 用 于 控制 USB 设备 的 数据 结构 。 
e 把 已 初始 化 数据 结构 的 指针 保存 到 接口 设备 中 。 
usb set intfdata()PK Zi HJ LJ t E usb. interface 的 私有 数据 ， 这 个 函数 的 原型 为 : 
void usb set intfdata (struct usb interface *intf, void *data); 
这 个 函数 的 “ 反 函 数 ” 用 于 得 到 usb. interface 的 私有 数据 ， 其 原型 为 : 
void *usb get intfdata (struct usb interface *intf); 
e 注册 USB 设备 。 
如 果 是 简单 的 字符 设备 ， 调 用 usb_register_dev0， 这 个 函数 的 原型 为 


int usb register dev(struct usb interface *intf, 
























































































































































































































































































































































































































































struct usb class driver *class driver); 


上 述 函 数 中 第 二 个 参数 为 usb_class_driver 结构 体 ， 这 个 结构 体 的 定义 如 代码 清单 20.15 所 示 。 
代码 清单 20.15 usb class driver 结构 体 


1 struct usb class driver 

2 char *name; /*sysfs 中 用 来 描述 设备 名 */ 

3 struct file operations *fops;/* 文 件 操 作 结 构 体 指针 */ 

4 int minor base; /* 开 始 次 设备 号 */ 

S dg 

对 于 字符 设备 而 言 ，usb_class_driver 结构 体 的 fops 成 员 中 的 write0、read0、ioctl0 等 函数 的 
地 位 完全 等 同 于 本 书 第 6 章 中 的 file operations 成 员 函 数 。 

如 果 是 其 他 类 型 的 设备 ， 如 tty 设备 ， 则 调用 对 应 设备 的 注册 函数 。 

在 USB 设备 驱动 usb_driver 结构 体 的 探测 函数 中 ， 应 该 完成 如 下 工作 。 
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e 释放 所 有 为 设备 分 配 的 资源 。 

e 设置 接口 设备 的 数据 指针 为 NULL。 

e 注销 USB 设备 。 

对 于 字符 设备 ， 可 以 直接 调用 usb register devOP Zt] “RAX”, 如 下 所 示 : 


void usb deregister dev(struct usb interface *intf, 













































































struct usb class driver *class driver); 


对 于 其 他 类 型 的 设备 ， 如 tty 设备 ， 则 调用 对 应 设备 的 注销 函数 。 
20.3.4 USB 骨架 程序 
Linux 内 核 源 代码 中 的 driver/usb/usb-skeleton.e 文件 为 我 们 提供 了 一 个 最 基础 的 USB 驱动 程 
序 ， 即 USB 骨架 程序 ， 可 被 看 做 一 个 最 简单 的 USB 设备 驱动 实例 。 尽 管 具体 USB 设备 驱动 千 差 
万 别 ， 但 其 骨架 则 万 变 不 离 其 宗 。 
首先 看 看 USB 骨架 程序 的 usb_driver 结构 体 定 义 ， 如 代码 清单 20.16 所 示 。 


代码 清单 20.16 USB 骨架 程序 的 usb_driver 结构 体 






























































































































































1 static struct usb driver skel driver = { 
2 .name = "Skeleton", 

3 .probe = skel probe, 

4 .disconnect -skel disconnect, 

5 .Suspend - Skel suspend, 

6 .resume - Skel resume, 

di .pre reset - skel pre reset, 

8 .post reset -skel post reset, 

9 .id table =  skel table, 

10 .Supports autosuspend - 1, 

















从 上 述 代码 第 9 行 可 以 看 出 , 它 所 支持 的 USB 设备 的 列表 数组 为 skel_table[]， 其 定义 如 代码 
青 单 20.17 所 示 。 











Lu 











代码 清单 20.17 USB 骨架 程序 的 id_table 

1 static struct usb device id skel table [] = ( 
2 ( USB DEVICE(USB SKEL VENDOR ID, USB SKEL PRODUCT ID) ], 
3 B /* Terminating entry */ 
4 Jj); 

5 MODULE DEVICE TABLE(usb, skel table); 

对 上 述 usb driver 的 注册 和 注销 发 生 在 USB ttr ZR FE FF BPSCEROI CIS HEBEL ,— n (Cog 
单 20.18 所 示 ， 其 分 别 调用 了 usb register()fll usb. deregister(). 


代码 清单 20.18 USB 骨架 程序 的 模块 加 载 与 卸载 函数 
sare cmt totis IS See TET mE NER Oi xr Gl) 


{ 


int result; 

































































/* 注册 USB 驱动 */ 
result = usb register(&skel driver); 
if (result) 


OO^ 3" ON CUm us Oo B9 pe 


err("usb register failed. Error number $d", result); 
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eoo 




















9 
oTr StuUrn result, 
Lp 
2 Static vord exit usb- skel exit(voilid) 
SET 
4 /* 注销 USB 驱动 */ 
3 usb deregister(&skel driver); 
OE 
usb driver 的 probe0 成 员 函 数 中 ， 会 根据 usb interface 的 成 员 寻 找 第 一 个 批量 输入 和 输出 端点 ， 


























将 端点 地 址 、 绥 冲 区 等 信息 存 入 为 USB 骨架 程序 定义 的 usb skel 结构 体 ， 并 将 usb skel 实例 的 指针 
f£ usb set intfdata0 作 为 USB 接口 的 私有 数据 , 最 后 , 它 会 注册 USB 设备 , 如 代码 清单 20.19 所 示 。 


代码 清单 20.19 USB 骨架 程序 的 探测 函数 
































static int skel probe(struct usb interface *interface, const struct usb device id *id) 
{ 
struct usb skel *dew = NULI? 


struct usb host interface *iface desc; 


size t buffer size; 
asme c aLg 


El 
2 
9 
4 
5 struct usb endpoint descriptor endpoint, 
6 
Ji 
8 int retval = -ENOMEM; 

E 




















0 /* 分 配 设备 状态 的 内 存 并 初始 化 */ 

1 dev = kzalloc(sizeof(*dev), GFP KERNEL); 

2 if (dev == NULL) ( 

3 err("Out of memory"); 

4 goto error; 

Sony 

6 kref init(&dev-kref); 

7 sema init(&devolimit sem, WRITES IN FLIGHT); 

8 

9  devoudev = usb get dev(interface to usbdev (interface)); 

20  devointerface = interface; 

21 

22 /* 设置 端点 信息 */ 

23  /* 仅 使 用 第 一 个 bulk-in 和 bulk-out */ 

24 iface desc = interface cur altsetting; 

2/5) for (i7 0; i « iface descodesc.bNumEndpoints; -*-*i) ( 

26 endpoint = &iface descoendpoint[i].desc; 

ed 

28 if (!dev-bulk in endpointAddr && 

29 ((endpoint-obEndpointAddress & USB ENDPOINT DIR MASK) 
30 == USB DIR IN) && 

E ((endpoint-obmAttributes & USB ENDPOINT XFERTYPE MASK) 
32 == USB ENDPOINT XFER BULK)) { 

33 /* 找到 了 一 个 批量 IN 端点 */ 

34 buffer size = lel6 to cpu(endpoint-wMaxPacketSize); 
39 dev>bulk_in_size = buffer size; 

36 devobulk in endpointAddr = endpoint-bEndpointAddress; 
Ou) devobulk in buffer = kmalloc(buffer size, GFP KERNEL); 
38 a (ele ieu in buffer) 4 
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39 err("Could not allocate bulk in buffer"); 
40 goto error; 
41 } 
42 } 
43 
44 if (!dev-bulk out endpointAddr && 
45 ((endpoint-obEndpointAddress & USB ENDPOINT DIR MASK) 
46 == USB DIR OUT) && 
47 ((endpoint-obmAttributes & USB ENDPOINT XFERTYPE MASK) 
48 == USB ENDPOINT XFER BULK)) { 
49 /* 找到 了 一 个 批量 OUT 端点 */ 
50 devobulk out endpointAddr = endpoint-bEndpointAddress; 
S ) 
52 } 
DS if (!(devobulk in endpointAddr && devobulk out endpointAddr)) { 
54 err("Could not find both bulk-in and bulk-out endpoints"); 
55; goto error; 
56- jJ 
57 
58 ”/* 在 设备 结构 中 保存 数据 指针 */ 
59 usb set intfdata(interface, dev); 
60 
61 /* 注册 USB 设备 */ 
62  retval = usb register dev(interface, &skel class); 
63 if (retval) ( 
64 /* something prevented us from registering this driver */ 
65 err("Not able to get a minor for this device."); 
66 usb set intfdata(interface, NULL); 
671 goto error; 
68 ] 
69 
70 
EIT, 
usb_skel 结构 体 可 以 被 看 作 一 个 私有 数据 结构 体 ， 其 定义 如 代码 清单 20.20 所 示 ， 应 该 根据 具 
体 的 设备 量 身 定制 。 
代码 清单 20.20 USB 骨架 程序 的 自 定义 数据 结构 usb_skel 
1 erence napis 
2 struct usb device * udev; /* 该 设备 的 usb_qevice 指针 */ 
3 struct usb interface *interface; /* 该 设备 的 usb_interface 指针 */ 
4 struct semaphore limit sem; /* 限制 进程 写 的 数量 */ 
5 unsigned char * bulk in buffer; /* 接收 数据 的 缓冲 区 */ 
6 size t bulk in size; /* 接收 缓冲 区 大 小 */ 
7 _ u8 bulk in endpointAddr; /* 批 量 IN 端点 的 地 址 */ 
8 _ u8 bulk out endpointAddr; /* 批量 oUT 端点 的 地 址 */ 
E 
10 struct mutex io mutex; 
db oy 
USB 骨架 程序 的 断 开 函 数 会 完成 探测 函数 相反 的 工作 ， 即 设置 接口 数据 为 NULL, 注销 USB 
设备 ， 如 代码 清单 20.21 所 示 。 
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代码 清单 20.21 USB 骨架 程序 的 断 开 函 数 


static void skel disconnect(struct usb interface *interface) 
{ 
struct usb_skel *dev; 


ODO 


int minor = interface minor; 


/* MHIE skel open() 5E skel disconnect () KA */ 


lock kernel(); 





dev = usb. get intfdata (interface); 


usb set intfdata(interface, NULL); 


/* 注销 usb 设备 ， 释 放 次 设备 号 */ 
usb deregister dev (interface, 





&skel class); 


unlock kernel(); 











/* 减少 下 





用 计数 */ 





OD mI RN a. QU NX Pet cx 


kref put(&dev-kref, 


Skel-delete); 





«o 


20 
2a 


代码 清单 20.18 第 62 行 的 usb_register_dev(interface, &skel_class) 中 第 参数 包含 了 字符 设 
备 的 file operations 结构 体 指针 ， 而 这 个 结构 体 中 的 成 员 实 现 也 是 USB 字符 设备 的 另 一 个 组 成 成 
分 。 代 码 清单 20.22 给 出 了 USB 骨架 程序 的 字符 设备 文件 操作 file operations 结构 体 的 定义 。 


代码 清单 20.22 USB 骨架 程序 的 字符 设备 文件 操作 结构 体 


Static const struct file operations skel fops - ( 
.owner - THIS MODULE, 
.read = Skel read, 


info("USB Skeleton 4d now disconnected", minor); 






































E 






























































.write - skel write, 
.open = Skel open, 
.release - Skel release, 
.flush = skel flush, 
; 
FRE SARIEI E AET, open) R K 
备 号 通过 usb_find_interface() 获 得 USB 接口 ， 


予 file 一 private_data， 如 代码 清单 20.23 所 示 。 


ED 



































数 的 实现 非常 简单 ， 它 根据 usb. driver 和 次 设 
后 通过 usb_get_intfdata0) 获 得 接口 的 私有 数据 并 赋 





































































































代码 清单 20.23 USB 骨架 程序 的 字符 设备 打开 函数 


1 static int skel open(struct inode *inode, struct file *file) 
2, d 

3 grruet usb skel "*dev; 

4 grruet usb interface *inberface; 

3) int subminor; 

6 int retval - 0; 
F 

8 

9 

1 

dL 


subminor = iminor (inode); 











interface = usb find interface(&skel driver, subminor); /* 获 得 接口 数据 */ 





Es 05 
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2 
3 dev = usb get intfdata (interface); 
4 
5 
6 kref get(&devokref); 
3l 
8  mutex lock(&dev-io mutex); 
9 
20 if (!devoopen count++) { 
Zl retval = usb autopm get interface(interface); 
2:2 if (retval) ( 
219) devoopen count--; 
24 mutex unlock(&devoio mutex); 
25 kref_put (&dev>kref, skel delete); 
26 goto exit; 
24 H 
28 j 
2/9 
30 file—private data = dev; /* 将 接口 数据 保存 在 file—private data 中 */ 
Bi mutex unlock(&devoio mutex); 
B2 n 
3S d 
































于 在 open0 函 数 中 并 没有 申请 任何 软件 和 硬件 资源 ， 因 此 与 open0) 函 数 对 应 的 releaseO ER ZA 
不 用 进行 资源 的 释放 ， 它 进行 减少 在 open0 中 增加 的 引用 计数 等 工作 。 
接 下 来 要 分 析 的 是 读 写 函 数 ， 前 面 已 经 提 到 ， 在 访问 USB 设备 的 时 候 ， 贯 穿 于 其 中 的 “中 机 
神经 ”是 urb 结构 体 。 
在 skel write0) 函 数 中 进行 的 关于 urb. 的 操作 与 20.3.2 小 节 的 描述 完全 对 应 ， 即 进行 了 urb 的 
分 配 (调用 usb_alloc_urb0)、 初 始 化 〈 调 用 usb fill bulk_urbO0) 和 提交 (调用 usb submit urb? 
的 操作 ， 如 代码 清单 20.24 所 示 。 


代码 清单 20.24 USB 骨架 程序 的 字符 设备 写 函 数 


1 static ssize t skel write (struct file *file, const char *user buffer, size t count, loff t *ppos) 














































































































[xi 












































































































































2E 
9 Mets 
4 /* 创建 Urb、urb EP, TOES urb */ 
5) urb = usb alloc urb(0, GFP KERNEL); 
6 
7| 
8 buf = usb buffer alloc (dev udev, writesize, GFP KERNEL, &urb-transfer dma); 
9 
0 
1 if (copy from user (buf, user buffer, writesize)) { 
2 retval = -EFAULT; 
3 goto error; 
4 } 
5 
6 
7 
8 usb fill bulk urb(urb, dev-udev, 
9 usb sndbulkpipe (devoudev, dev bulk out endpointAddr), 
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20 buf, writesize, skel write bulk callback, dev); 
Zu urb ,transfer flags |= URB NO TRANSFER DMA MAP; 

22 usb anchor urb(urb, &devosubmitted); 

23 

24  /* FPES ASSERIT */ 

25 retval = usb submit urb(urb, GFP KERNEL); 

26 

29 

28  /* 释放 对 urb 的 引用 ，USB 将 最 终 完全 释放 之 */ 

29 usb free urb (urb 
30 

2 return writesize; 
32 

SS 

34 } 


写 函 数 中 发 起 的 urb 结束 后 ， 其 完成 函数 skel write bulk _callbackO 将 被 调用 ， 它 会 进行 
urb- status 的 判断 ， 如 代码 清单 20.25 所 示 。 


代码 清单 20.25 USB 骨架 程序 的 字符 设备 写 操作 完成 函数 


eoo 
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static void skel write bulk callback(struct urb *urb, struct pt regs *regs) 
{ 
EC 


$ 
2 
3 
4 
5 dev = (struct usb-skel *jurbscontext; 
6 
7 
8 


9 /* 释放 被 分 配 的 内 存 */ 

10 usb buffer free(urb dev, urbotransfer buffer length, 
3L urbotransfer buffer, urb-stransfer dma); 

12 up(&dev-limit sem); 

jen 


USB 骨架 程序 的 字符 设备 读 函 数 并 没有 进行 类 似 写 函 数 的 一 系列 针对 urb 的 操作 ， 而 是 简单 
地 调用 usb. bulk msg0 发 起 一 次 同步 urb 传输 操作 ， 如 代码 清单 20.26 所 示 。 


代码 清单 20.26 USB 骨架 程序 的 字符 设备 读 函 数 
























































static ssize t skel read(struct file *file, char *buffer, size t count, loff t *ppos) 
{ 

Struct usb skel *dev; 

int retval - 0; 


$ 

2 

3 

4 

5 int bytes read; 
6 

7 dev = (struct usb skel *)file-private data; 
8 














9 ”/* 从 设备 进行 一 次 阻塞 的 批量 读 */ 
10 retval = usb bulk msg (devoudev, 


11 usb rcvbulkpipe (dev oudev, devobulk in endpointAddr), 
32) dev-bulk in buffer, 

T3 min(dev-bulk in size, count), 

14 &bytes read, 10000); 
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15; 


16  /* 如 果 读 成 功 ， 将 数据 复制 至 

















3b abi (C lye 











I 用 户 空间 */ 


18 if (copy to user (buffer, dev bulk in buffer, bytes read)) 
I9 retval = -EFAULT; 

20 else 

2. retval = bytes read; 

27 2 

23 

24 return retval; 

258 


20.3.5 实例 : USB 键盘 驱动 


在 Linux 系统 中 ， 键 盘 被 认定 为 标准 输入 设备 ， 对 于 一 个 USB 键盘 而 言 ， 其 驱动 主 














分 组 成 : usb_driver 的 成 员 函 数 以 及 输入 设备 驱动 的 input_event 获取 和 报告 。 
加 载 和 外 载 函数 中 ， 将 分 别 注册 和 注销 对 应 于 USB 键盘 的 
20.27 所 示 为 模块 加 载 与 代 载 函数 以 及 usb_kbd_driver 


在 USB 键盘 设备 驱动 的 模 甘 
usb driver 结构 体 usb kbd driver, RIB} 
结构 体 的 定义 。 





AD^ 00 ow oy UY ds oOx B tk 































































































代码 清单 20.27 USB 键盘 设备 驱动 的 模块 加 载 与 卸载 函数 及 usb_driver 结构 体 





{ 
name = Se 


ZEB KON CPU dede 0) EET 





24 y; 
25 MODULE DEVICE TABLE (usb, usb kbd id table); 


在 usb driver 的 探测 函数 中 ， 将 进行 input 设备 的 初始 化 和 注册 ，USB 键盘 要 使 


Rut 





BJ urb 的 初始 化 ， 并 设置 接口 








usb deregister(&usb kbd driver); 


.probe = usb kbd probe, 














KAA C 


Statio dnb Anie usb kbd Imit (Gral (oL) 


int result = usb register(&usb kbd driver); 


static void _ exit usb kbd exit (void) 


Static struct usb driver usb kbd driver - 


.disconnect = usb kbd disconnect, 
.id table = usb kbd id table, 


static struct usb device id usb kbd id table [] -» ( 
( USB INTERFACE INFO(USB INTERFACE CLASS HID, USB INTERFACE SUBCLASS BOOT, 
USB INTERFACE PROTOCOL KEYBOARD) ], 




















的 




















居 ， 如 代码 清单 20.28 所 示 。 

















WT urb 








INUX 


USB 主机 与 设备 驱动 


代码 清单 20.28 USB 键盘 设备 驱动 的 探测 函数 


eoo 


static int usb kbd probe(struct usb interface *iface, const struct 
usb device id *1d) 


{ 


maxp = usb maxpacket(dev, pipe, usb pipeout (pipe)); 


kbd = kzalloc(sizeof(struct usb kbd), GFP KERNEL); 


kii 

2 

3 

4 MET 

5 pipe = usb rcvintpipe (dev, endpoint-obEndpointAddress); 

6 

7 

8 

9 input dev = input allocate device();/* 分 配 input_dev 结构 体 */ 












































0 
T yoi 
2 /* 输入 设备 初始 化 */ 
3 input_dev>name = kbd>name; 
4 input_dev>phys = kbd-phys; 
5; usb to input id(dev, &input devoid); 
6 input devocdev.dev = &ifacesdev; 
7 input dev ,private = kbd; 
8 
9 input devoevbit[0] = BIT(EV KEY) | BIT(EV LED) | BIT(EV REP); 
20 input devoledbit[0] = BIT(LED NUML) | BIT(LED CAPSLI) | 
21 BIT(LED SCROLLL) |BIT(LED COMPOSE) | BIT(LED KANA); 
22 
23 ES 
24  /* 初始 化 中 断 urb */ 
25 usb fill int urb(kbd-irq, dev, pipe, kbd.new, (maxp > 8 ? 8 : maxp), 
26 usb kbd irq, kbd, endpoint.bInterval); 
2] kbdoirqotransfer dma = kbd ,new dma; 
28 kbd ,irq transfer flags |= URB NO TRANSFER DMA MAP; 
2:9 
30 EE 
31  /* 初始 化 控制 uzb */ 
52 usb fill control urb(kbdoled, dev, usb sndctrlpipe(dev, 0), (void*)kbd-cr, 
33| kbd-2leds, 1, usb kbd led, kbd); 
34 ix 
35 input register device(kbd-dev); /* 注册 输入 设备 */ 
36 
37 usb set intfdata(iface, kbd); /* 设置 接口 私有 数据 */ 
38 return 0; 
DI9 
40 ] 
在 usb driver 的 断 开 函数 中 ， 将 设置 接口 私有 数据 为 NULL、 终 止 已 提交 的 urb. 并 注销 输入 


















































设备 ， 如 代码 清单 20.29 所 示 。 
代码 清单 20.29 USB 键盘 设备 驱动 的 断 开 函数 








static void usb kbd disconnect(struct usb interface *intf) 
{ 
struct usb kbd *kbd - usb.get intfdata(intf); 

















if (kbd) 
{ 


1 
2 

3 

4 

5 usb set intfdata(intf, NULL);/* 设置 接口 私有 数据 为 NULIL */ 
6 

7 

8 usb kill urb(kbdoirq);/* 终止 urb */ 
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9 input unregister device(kbdodev); /* 注销 输入 设备 */ 
10 usb kbd free mem(interface to usbdev(intf), kbd); 
wI kfree (kbd); 

12 

O: 






























































键盘 主要 依赖 于 中 断 传 输 模式 ， 在 键盘 中 断 urb 的 完成 函数 usb_kbd_irq0 中 (通过 代码 清单 
20.28 的 第 26 行 可 以 看 出 )， 将 会 通过 input report key0 报 告 按键 事件 ， 通 过 input syncOdK 4 In] 
EF, ， 如 代码 清单 20.30 所 示 。 


代码 清单 20.30 USB 键盘 设备 驱动 的 中 断 urb 完成 函数 





i 





















































lim. 














SE 























1 static void usb kbd irq(struct urb *urb, struct pt regs *regs) 
2. 4 
3 struct usb kbd *kbqd 9 urbscontext; 
4 dep dup 
5 

6 Bwitch (urbestatus) T 
7 case 0: /* Duni */ 

8 break; 

9 case - ECONNRESET: /* unlink */ 

0 case - ENOENT: 

1 case - ESHUTDOWN: 

2 return ; 

3 default: /* cH */ 

4 goto resubmit; 

5 } 

6 /* 获 得 键盘 扫描 码 并 报告 按键 事件 ， 这 里 没有 列 出 细节 */ 

7 

8 input report key(kbd-dev, usb kbd keycode[kbd-old[i]]l, 0); 
9 

20 input report key(kbd-dev, usb kbd keycode[kbd-new[i]l]l, 1); 
21 Eon 

22 input sync(kbd-—dev); /* 报告 同步 事件 */ 

29 

24 resubmit: 

25 i = usb submit urb (urb, GFP ATOMIC); 

26 

25158 














从 USB 键盘 驱动 的 例子 中 ， 我 们 进一步 看 到 了 usb driver 本 身 只 是 起 一 个 挂 接 总 线 的 作用 ， 
而 具体 的 设备 类 型 的 驱动 仍然 是 工作 的 主体 ， 例 如 键盘 就 是 inputs USB 串口 就 是 tty， 只 是 在 这 
些 设备 底层 进行 硬件 访问 的 时 候 , 调用 的 都 是 URB 相关 的 接口 ,URB 这 套 USB 核心 层 API 的 存 
在 ， 使 我 们 无 需 关 心底 层 USB 主机 控制 器 的 具体 细节 ， 因 此 ，USB 设备 驱动 也 变 得 与 平台 无 关 ， 
同样 的 驱动 可 应 用 于 不 同 的 SoC。 
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20.4 USB UDC 5& gadget 驱动 


20.4.1 UDC 和 gadget 驱动 关键 数据 结构 与 API 
这 里 的 USB 设备 控制 器 (UDC ) 驱动 指 作为 其 他 USB 主机 控制 器 外 设 的 USB 硬件 设备 上 底 
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层 硬 件 控制 器 的 驱动 , 该 硬件 和 驱动 负责 将 一 个 USB 设备 依附 于 一 个 USB 主机 控制 器 上 。 例 如 ， 
当 某 运行 Linux 的 手机 作为 PC 的 U 盘 时 ， 手 机 中 的 底层 USB 控制 器 行使 USB 设备 控制 器 的 功 
能 ， 这 时 候 运 行 在 底层 的 是 UDC 驱动 ， 而 手机 要 成 为 U dS. 在 UDC 驱动 之 上 仍然 需要 另外 一 个 
了 驱动， 对 于 USB 大 容量 存储 器 为 fle storage 驱动 ， 这 一 驱动 称 为 gadget 驱动 。 从 图 20.1 左边 可 
以 看 出 ，USB 设备 驱动 调用 USB 核心 的 API， 因 此 具体 驱动 与 SoC 无 关 ; 同样 ， 从 图 20.1 右边 
可 以 看 出 ，USB gadget 驱动 调用 通用 的 gadget API， 因 此 具体 gadget 驱动 也 变 得 与 SoC 无 关 。 软 
件 分 层 设计 的 好 处 再 一 次 得 到 了 深刻 的 体现 。 

UDC 驱动 和 gadget 驱动 都 位 于 内 核 的 drivers/usb/gadget 目录 ，omap_udc.c、pxa27x_udc.c、 
m66592-udc.c、s3c2410_udc.c 等 是 对 应 SoC 平台 上 的 UDC 驱动 ,ether.c、 f serial.c. file storage.c 
等 文件 实现 了 一 些 gadget 驱动 ， 重 要 的 gadget 驱动 如 下 所 示 。 

Gadget Zero: 该 驱动 用 于 测试 udc 驱动 ， 它 会 帮助 您 通过 USB-IF 测试 。 

Ethernet over USB: 该 驱动 模拟 以 太 网 网 口 ， 它 支持 多 种 运行 方式 一 一 CDC Ethernet CRIER 
准 的 Communications Device Class "Ethernet Model" 协议 )、CDC Subset( 由 于 硬件 受 限 , 仅 实 现 CDC 
Ethernet 的 一 个 子 集 ,不 舍 altsetting) 以 及 RNDIS (微软 公司 对 CDC Ethernet. 的 变种 实现 ) 这 几 
种 模式 。 

File-backed Storage Gadget: 最 常见 的 U 盘 功 能 实现 。 

Serial Gadget: 包括 Generic Serial 实现 (只 需要 Bulk-in/Bulk-out 端点 tep0) 和 CDC ACM 规 
范 实现 。 内 核 源 代码 中 的 Documentation/usb/gadget_serial.txt 文档 讲解 了 如 何 将 Serial Gadget 与 
Windows 和 Linux 主机 连接 。 

Gadget MIDI: 暴露 ALSA MIDI 接口 。 

另外 ,drivers/usb/gadget 源 代码 还 实现 了 一 个 Gadget 文件 系统 (GadgetFS), 可 以 将 Gadget APT 

接口 暴露 给 应 用 层 ， 以 便 在 应 用 层 实现 用 户 空间 的 驱动 。 
在 USB 设备 控制 器 与 gadget 驱动 中 ， 我 们 主要 关心 几 个 核心 的 数据 结构 ， 这 些 数据 结构 包 
括 描述 一 个 USB 设备 控制 器 的 usb_gadget、 描 述 一 个 gadget 驱动 的 usb. gadget _ driver、 表 示 一 个 
传输 请 求 的 usb_request( 与 从 主机 端 看 到 的 urb 相似 )、 描 述 一 个 端点 的 usb_ep、 描 述 端点 操作 的 
usb ep ops 结构 体 。UDC 和 gadget 驱动 围绕 这 些 数据 结构 及 其 成 员 函 数 而 展开 ， 代 码 清单 20.31 
列 出 了 这 些 关 键 的 数据 结构 ， 都 定义 于 include/linux/usb/gadget.h 文件 。 


代码 清单 20.31 UDC 和 gadget 驱动 关键 数据 结构 
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1 struct usb gadget { 

2 /* 针对 gadget 驱动 只 读 */ 

3 const struct usb gadget ops *ops; /* 访问 硬件 的 函数 */ 

4 struct usb ep *ep0; /* endpoint 0, setup 使 用 */ 

5 struct list head ep list; /* 其 他 endpoint 的 列表 */ 

6 enum usb device speed Speed; 

q unsigned is dualspeed:1;7 

8 unsigned aki. oor be 

9 unsigned is a peripheral:1; 

10 unsigned b hnp enable:1; /* A-HOST 使 能 了 HNP 支持 */ 
11 unsigned a hnp support:1; /* A-HOST 支持 HNP */ 
12 unsigned e b fnejo eue» Ede 

t3 const char *name; 
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14 struct device dev; 

159. 3/8 

16 

17 struct usb gadget driver ( 

18 char *function; /* 描述 gadget 功能 的 字符 串 */ 
19 enum usb device speed speed; 

20 int (*bind) (struct usb gadget *); /* 当 了 驱动 与 gadget 绑 定时 调用 */ 
2 void (*unbind) (struct usb gadget *); 

22 int (*setup) (struct usb gadget *, /* 处 理 硬件 驱动 未 处 理 的 epo Wick */ 
23 const struct usb ctrlrequest *); 
24 void (*disconnect) (struct usb gadget *); 

25 void (*suspend) (struct usb gadget *); 

26 void (*resume) (struct usb gadget *); 

21 

28 struct device driver driver; 

ZONE 

30 

31 struct usb request ( 

32 void Bs 

33 unsigned length; 

34 dma addr t dma; 

235 

36 unsigned nonten rupti 

a unsigned zero:1; 

38 unsigned iinienaic; ie. (OU Edo 

39 

40 void (*complete) (struct usb ep *ep, 

41 struct usb request *req); /* 当 请 求 完成 时 调用 的 函数 */ 
42 void contest 

43 struct list head JERSE 

44 

45 ne STELIS 

46 unsigned Siero NEG 

47 B 

48 

49 struct usb ep ( 

50 void *driver data; 

51 

52 const char *name; 

5S const struct usb ep ops *ops; 

54 struct list head ep list; 

55 unsigned maxpacket:16; 

56 ); 

Si 

58 struct usb ep ops ( 

59 int (*enable) (struct usb ep *ep, 

60 const struct usb endpoint descriptor *desc); 

61 int (*disable) (struct usb ep *ep); 

62 

63 struct usb request *(*alloc request) (struct usb ep *ep, 
64 grp t gfp flaus); 

65 void (*free request) (struct usb ep *ep, struct usb request *req); 
66 
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oo 























67 int (*queue) (struct usb ep *ep, struct usb request *req, 

68 gfp t gfp f£1ags);/* lf usb request 提交 给 endPoint， 进 行 数据 传输 */ 
69 int (*dequeue) (struct usb ep *ep, struct usb request *req); 

70 

3L int (*set halt) (struct usb ep *ep, int value); 

72 int (*set wedge) (struct usb ep *ep); 

Ea 

74 mae Ceiro S icis Us NN (raet mes ed "ss 

35 volel (vibe) srdbmeeds) (erruet ueo cie. e) 

76 ); 

在 具体 的 UDC 驱动 中 ， 需 要 封装 usb_gadget 和 每 个 端点 usb_ep， 实 现 端点 的 usb ep ops. 








ali 











成 usb request. 5j^/h, usb gadget register driver(). usb gadget unregister driver()1X j^^ API 
要 由 UDC 驱动 提供 ，gadget 驱动 会 调用 它们 ， 其 原型 分 别 为 : 


int usb gadget register driver(struct usb gadget driver *driver); 





pl 









































int usb gadget unregister driver (struct usb gadget driver *driver); 

usb gadget register driver()3 % 1E gadget 驱动 的 模块 初始 化 时 调用 ， 该 函数 中 通常 会 调用 
driver— bind()P Zt, iZ usb gadget driver 与 具体 的 gadget 绑 定 ， 该 函数 最 好 放 在 init 节 内 。 

usb_gadget_register_driver() 通 常 在 gadget IKZI B FEE HU ANE URL, d UE) UDC 驱动 
不 再 投入 工作 。 如 果 UDC E5 USB 主机 连接 ， 会 先 调用 driver disconnectO P 2X, 7E usb_ 
gadget register_driver0 函 数 返 回 前 ， 也 需 调 用 driver>unbind() 函 数 。 所 以 unbind0 函 数 适 合 放 在 
exit 节 。 

在 linux/usb/gadget.h 中 ， 还 封装 了 一 些 常 用 的 API， 如 下 所 示 。 

(1) 使 能 和 禁止 端点 。 


static inline int usb ep enable(struct usb ep *ep, 




























































































































































































const struct usb endpoint descriptor *desc); 
static inline int usb ep disable(struct usb ep *ep); 


它们 分 别 调用 了 “ep 一 ops 一 enable(ep, desc);" fll *ep—ops-disable(ep); ". 
(2) 分 配 和 释放 usb. request. 
static inline struct usb request *usb ep alloc request(struct usb ep *ep, 


GERE OEP LLAJ) 
static inline void usb ep free request(struct usb ep *ep, 





























struct usb request *req); 
它们 分 别 调用 了 “ep 一 ops 一 alloc_request(ep, gfp flags); " fll *ep-ops—free request(ep, req); "- 
用 于 分 配 和 释放 一 个 依附 于 某 端点 的 usb. request. 
(3) 提交 和 取消 usb request. 


static inline int usb ep queue(struct usb ep *ep, 
































struct usb request *req, gfp t gfp flags); 
static inline int usb ep dequeue(struct usb ep *ep, struct usb request *req); 


'€ 114: 3] V8 H] *ep—ops-queue(ep, req, gfp flags) ;" F *ep—ops-dequeue(ep, req); ". 
usb ep queue 函数 告诉 UDC 完成 usb request (Ej buffer)， 当 请 求 被 完成 后 ， 该 请 求 对 应 的 
completion 函数 会 被 调用 。 

(4) 端点 FIFO 管理 。 






































static inline int usb ep fifo status(struct usb ep *ep); 
static inline void usb ep fifo flush(struct usb ep *ep); 


前 者 调用 “ep 一 ops 一 fifo_status(ep)” 返 回 目前 FIFO 中 的 字 节 数 , 后 者 调用 “ep 一 ops 一 fifo_flush(ep)” 
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以 flush 掉 FIFO 中 的 数据 。 

(5) 返回 目前 的 帧 号 。 

static inline int usb gadget frame number(struct usb gadget *gadget); 

它 调用 “gadget 一 ops 一 get_frame(gadget)” 返 回 目前 的 帧 号 ， 正 常 为 自 SOF 以 来 的 一 个 11 位 
数 ， 如 果 设 备 不 文 持 该 能 力 ， 则 返回 出 错 码 。 

C60 管理 配置 描述 符 。 


int usb descriptor fillbuf(void *, unsigned, 














































































































const struct usb descriptor header **); 
int usb gadget config buf(const struct usb config descriptor *config, 
void *buf, unsigned buflen, const struct usb descriptor header **desc); 
static inline void usb free descriptors(struct usb descriptor header **v); 


其 他 API 还 包括 usb gadget vbus connect(). usb gadget vbus disconnect(). usb ep set halt(). 














usb ep clear halt(). usb gadget vbus draw(). usb gadget wakeup(). usb gadget set selfpowered(). 
usb gadget clear selfpowered(). usb gadget connect(). usb gadget disconnect. usb ep set wedge() 
等 ， 处 理 USB 总 线 上 的 一 些 电源 管理 、OTG 协议 等 ， 详 见 include/linux/usb/gadget.h o 


20.4.2 实例 : S3C6410 USB 2.0 的 UDC 驱动 


S3C6410 除了 一 个 USB1.1 主机 接口 以 外 ， 还 包括 一 个 USB 2.0 支持 OTG 的 控制 器 。 它 既 支 
持 主机 ， 又 支持 外 设 功能 。 当 使 能 USB_S3C_OTG_HOST 选项 (EH “S3C USB OTG Host support” 
HY),  drivers/usb/host/s3c-otg 目录 中 的 源码 被 选中 ， 实 现 主机 控制 器 驱动 ; 当 使 能 
USB GADGET S3C OTGD (HJ “S3C HS USB OTG Device") Wf, drivers/usb/gadget/s3c udc otg.c 
被 编译 ， 成 为 一 个 UDC。 

drivers/usb/gadget/s3c udc.h 中 定义 了 一 个 s3c_udc 结构 体 ， 将 S3C6410 UDC 的 gadget, 
usb gadget driver. endpoint 等 封装 在 一 起 ， 而 drivers/usb/gadget/s3c udc otg.c 则 定义 了 一 个 它 的 
实例 ， 如 代码 清单 20.32 所 示 。 


代码 清单 20.32 S3C6410 UDC 驱动 的 s3c_udc 结构 体 以 及 实例 


ed S30- ele i 


























































































































Struct usb gadget gadget; 

struct usb gadget driver *driver; 
struct platform device *dev; 

Seb oboe "diexeliso 


int epOstate; 
struct s3c ep ep[S3C MAX ENDPOINTS]; 


jo Me ons da EO E Rn TE o AR 


unsigned char usb address; 


unsigned req pending:1, req std:1, req config:1; 
}; 


static struct s3c udc memory - ( 
.usb address = O0, 


fa 0 AK e oR TO ue a? KEG pnt CS 





.gadget = { 
19 .Ops = &s3c udc ops, 
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e 
D 

20 .ep0 = &memory.ep[0].ep, ® 

21 .name = driver name, 

22 .dev = { 

23 .bus_id = "gadget", 

24 .release = nop_release, 

25 ), 

26 ), 

2 

28  /* 控制 器 endpoint */ 

29 .ep[0] = { 

30 ep = { 

31 .name = epOname, 

32 .Ops = &s3c ep ops, 

29 .maxpacket = EPO FIFO SIZE, 

34 ), 

SIE .dev = &memory, 

36 

ui .bEndpointAddress - 0, 

38 .bmAttributes - 0, 

29 

40 .ep type = ep control, 

41 .fifo - (unsigned int) S3C UDC OTG EPO FIFO, 

42 ), 

43 

dal EXEC CST) CIT ORE SA 

45  .ep[1] »* ( 

46 ep e i 

47 .name = "epl-bulk", 

48 .Ops = &s3c ep ops, 

49 .maxpacket = EP FIFO SIZE, 

50 ), 

Si, .dev = &memory, 

52 

53 .bEndpointAddress - USB DIR OUT | 1, 

54 .bmAttributes - USB ENDPOINT XFER BULK, 

55 

56 .ep type = ep bulk out, 

57 -fu3fo — (unsigned u4nt) S3C-UDC-OTG-EPT-ELIEO, 

Se ), 

59 

60 .ep[2] = { 

61 eem 

62 .bEndpointAddress - USB DIR IN | 2, 

63 .bmAttributes = USB ENDPOINT XFER BULK, 

64 

65 .ep type = ep bulk in, 

66 ), 

67 

89 sP = í 

69 ond 

70 .bEndpointAddress - USB DIR IN | 3, 

qi .bmAttributes - USB ENDPOINT XFER INT, 

m2 

73 ), 

74 .ep[4] = ( 
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T5 A 
76 .bEndpointAddress = USB DIR OUT | 4 
m .bmAttributes - USB ENDPOINT XFER B 
78 m 

39) ), 

80 esee = 

81 GE 

82 .bEndpointAddress - USB DIR IN | 5, 
83 .bmAttributes = USB ENDPOINT XFER B 
84 

85 .ep type = ep bulk in, 

86 ), 

87 .ep[6] = ( 

88 2b. 

89 .bEndpointAddress - USB DIR IN | 6, 
90 .bmAttributes - USB ENDPOINT XFER I 
91 

92 .ep type = ep interrupt, 

9S ), 

94 .ep[7] = ( 

95 EON 

96 .bEndpointAddress - USB DIR OUT | 7 
ey .bmAttributes - USB ENDPOINT XFER B 
98 

99 .ep type = ep bulk out, 

100 is 

WOL 
102 



































UDC 的 各 个 端点 的 类 型 、 地 址 和 操作 。s3c_udc 类 型 的 memory 是 一 个 全 局 变量 ， 





, 


ULK, 


ULK, 


NT, 


, 


ULK, 





上 述 代码 的 第 18-26 行 是 对 UDC 整体 的 描述 以 及 操作 ， 从 第 29 行 起 ， 描 述 的 就 是 S3C6410 





实际 上 ， 在 
































drivers/usb/gadget/s3c udc otg.c 是 一 个 基于 platform 的 设备 驱动 的 probe() 过 程 中 ， 还 会 进一步 初 











始 化 memory 中 的 各 成 员 ， 例 如 通过 list_add_tail0 将 各 endpoint 添加 到 ep. list 等 
的 列表 配置 硬件 和 完成 
































drivers/usb/gadget/s3c udc otg.c 其 他 主要 工作 是 根据 endpoint 
usb request 数据 发 送 和 接收 请 求 ， 实 现 s3c udc ops 和 s3c_ep_ops 这 两 个 结构 体 的 成 员 函 数 ， 实 
现 usb gadget register driver(). usb gadget unregister driver)XX PA API 等 。 


20.4.3 实例 : file storage gadget 驱动 


file storage gadget 驱动 由 drivers/usb/gadget/file storage.c 文件 实现 ， 它 完成 的 主要 工作 如 下 。 
CI) 实现 usb_gadget_driver 实例 及 其 中 的 成 员 函 数 bind(). unbind(). disconnect(). setup 5. 
(2) 准备 作为 U 盘 外 设 的 设备 描述 符 usb_device_descriptor、 配 置 描述 符 usb config descriptor. 
接口 描述 符 usb_interface_descriptor、 端 点 描述 符 usb endpoint descriptor 等 。 
(3) 完成 与 虚拟 文件 系统 VFS 的 交互 ， 将 文件 作为 U 盘 映像 ， 透 过 vfs read(). vfs write() 
读 写 文件 ， 并 透 过 usb request 在 主机 与 gadget 间 交 换 数据 。 




























































































在 LDD6410 FRIRE, USB 2.0 OTG 的 原理 如 图 20.6 所 示 。 当 LDD6410 3 
drivers/usb/gadget/s3c udc otg.c 和 drivers/usb/gadget/file_storage.c 的 情况 下 ， 























g_file_storage 模块 并 传 入 一 个 映像 名 作为 参数 ， 即 可 帮 
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开发 板 内 核 配置 选 























通过 加 载 





FARE] U 盘 功 能 。 
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VDD_5V 
Q 





OTGDRV VBUS >Ð 


VBUS 





20.6 LDD6410 开发 板 USB 2.0 OTG 接口 原理 图 





LDD6410 开发 板 的 /demo 目录 包含 一 个 做 好 的 映像 vfat.img， 因 此 加 载 g_file_storag 的 命令 为 : 


# modprobe g file storage file-/demo/vfat.img stall=0 removable-1 








g file storage gadget: Filebacked Storage Gadget, version: 7 August 2007 
g file storage gadget: Number of LUNs-1 g file storage gadgetlun0: ro-0, file: 
/demo/vfat.img Registered gadget driver 'g file storage' 


vfatimg 可 以 在 PC 上 通过 dd 和 mkfs.vfat 命令 得 到 : 
$ dd if-/dev/zero of-vfat.img bs-1M count-20 
20-0 records in 























20-0 records out 

20971520 bytes (21 MB) copied, 0.195482 s, I07- MB/S 

$ sudo losetup /dev/loop0 vfat.img 

$ sudo mkfs.vfat /dev/loopO0 

mist sevi ade INI CI Ners 2N 

Loop device does not match a floppy size, using default hd params 
$ mkdir vfat mount point 

$ sudo mount t vrat /dev/loop0 vfat mount point 
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这 样 之 后 可 以 把 需要 的 文件 找 入 vfat mount point 目录 ， 完 成 后 umount vfat mount point H 
录 并 删除 loop0: 


$ sudo umount vfat mount point 
$ sudo losetup -d /dev/loopO 


2U.5 USB OTG 驱动 


USB OTG 标准 在 完全 兼容 USB 2.0 标准 的 基础 上 ， 它 人 允许 设备 既 可 作为 主机 ， 也 可 作为 外 设 
操作 ，OTG 新 增 了 主机 通令 协议 CHNP) 和 对 话 请 求 协议 (SRP)。 
在 OTG 中 ， 初 始 主机 设备 称 为 A 设备 ， 外 设 称 为 B 设备 。 可 用 电线 的 连接 方式 来 决定 初始 
角色 。 两 用 设备 使 用 新 型 mini-AB 插座 ， 从 而 使 mini-A 插头 、mini-B 插头 和 mini-AB 插座 增添 
了 第 5 个 引 脚 (ID)， 以 用 于 识别 不 同 的 电缆 端点 。mini-A 插头 中 的 ID 引 脚 接 地 ，mini-B 插头 中 
的 ID 引 脚 浮 空 。 当 OTG 设备 检测 到 接地 的 ID 引 脚 时 ， 表 示 默 认 的 是 A 设备 〈 主 机 )， 而 检测 到 
ID 引 脚 浮 空 的 设备 则 认为 是 B 设备 (外 设 )。 系 统一 旦 连接 后 ，OTG 的 角色 还 可 以 更 换 ， 采 用 新 
的 HNP 协议。 而 SRP 允许 B 设备 请 求 A 设备 打开 VBUS 电源 并 启动 一 次 对 话 。 一 次 OTG 对 话 
可 通过 A 设备 提供 VBUS 电源 的 时 间 来 确定 。 
自从 Linux 2.6.9 开始 ，OTG 相关 源 代码 已 经 被 包含 在 内 核 中 ， 新 增 的 主要 内 容 包括 : 
(1) UDC 驱动 端 添加 的 OTG 相关 属性 和 函数 。 


struct usb gadget { 






































































































































gm 





















































































































































































































































unsigned asi (OESTE dip 


unsigned is a peripheral:1; 
unsigned b hnp enable:1; 
unsigned cn Sn 
unsigned masc Spot 


; 


int usb gadget vbus connect(struct usb gadget *gadget); 
int usb gadget vbus disconnect(struct usb gadget *gadget); 


int usb gadget vbus draw(struct usb gadget *gadget, unsigned mA); 


/* 控制 USB D+ 的 pullup */ 
int usb gadget connect(struct usb gadget *gadget); 
int usb gadget disconnect(struct usb gadget *gadget); 


int usb gadget wakeup(struct usb gadget *gadget); 

(2) gadget 驱动 端 添加 的 OTG 相关 属性 和 函数 。 

如 果 gadget-is otg 字段 为 真 , 则 增加 一 个 OTG 描述 符 ; 通过 printk(). LED 等 方式 报告 HNP 可 用 ; 
当 suspend 开始 时 , 通过 用 户 界面 报告 HNP 切换 开始 CB-Peripheral 到 B-Host 或 A-Peripheralto A-Host)。 

(3) 主机 侧 添加 的 OTG 相关 属性 和 函数 。 

USB 核心 中 新 增 了 关于 OTG 设备 枚 举 的 信息 : 
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Struct usb- pus 4i 


ODO 


u8 otg_port; /* 0, or index of OTG/HNP port */ 


unsigned is b host:1; /* true during some HNP roleswitches */ 
unsigned b hnp enable:1; /* OTG: did A-Host enable HNP? */ 


}; 
为 了 实现 HNP 需要 的 suspend/resume， 新 增 如 下 通用 接口 : 


int usb suspend device(struct usb device *dev, u32 state); 




















int usb resume device(struct usb device "*dev); 
(4) 新 增 OTG 控制 器 otg transceiver. 


struct otg transceiver ( 








struct device *dev; 
const char *label; 


u8 default a; 
enum usb otg state state; 


sitruotonsb bus Boe. 

struct usb gadget *gadget; 

ER 

ul6 joXoweie JS oul 

ul6 port change; 

/* bind/unbind 主机 控制 器 */ 

int (*set host) (struct otg transceiver *otg, 
etruüctonab bus *Nast). 

/* bind/unbind 设备 控制 器 */ 

int (*set peripheral) (struct otg transceiver *otg, 





struct usb gadget *gadget); 
/* 对 B 设备 有 效 */ 
int (*set power) (struct otg transceiver *otg, 
unsigned mA); 
/* 针对 BB 设备 : 与 A-Host 进入 一 个 session */ 
int (*start srp) (struct otg transceiver *otg); 
/* 开始 /继续 HNP 角色 切换 */ 
int (*start hnp) (struct otg transceiver *otg); 















































H 

目前 ， 完 整 实现 OTG 文 持 的 驱动 非常 少 ， 例 如 目前 S3C6410 的 USB 2.0 控制 器 驱动 就 没 
有 完整 实现 OTG， 因 此 ， 我 们 无 法 在 运行 时 动态 切换 S3C6410 的 身份 ， 而 TI OMAP 处 理 器 的 
OTG 文 持 比较 完整 。 而 真正 支持 完整 OTG 功能 的 产品 也 非常 少 ，Nokia N810 internet Tablet 是 
其 中 之 一 ， 它 使 用 的 SoC 是 OMAP 2420。 其 他 大 多 号 称 支 持 OTG 的 产品 实际 上 并 未 完整 实现 
HNP 和 SRP。 


AR i. 


USB 驱动 分 为 USB 主机 驱动 和 USB 设备 驱动 , 如 果 系 统 的 USB 主机 控制 器 符合 OHCI 等 标 
， 这 主机 驱动 的 绝 大 部 分 工作 都 可 以 沿用 通用 的 代码 。 
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对 于 一 个 USB 设备 而 言 ， 它 至 少 具备 两 重 身 份 : 首先 它 是 “USB ”的 ， 其 次 它 是 “自己 ”的 。 
USB 设备 是 “USB” 的 ， 指 它 挂 接 在 USB 总 线 上 ， 其 必须 完成 usb_driver 的 初始 化 和 注册 ; USB 
设备 是 “自己 ”的 ， 意 味 着 本 身 可 能 是 一 个 字符 设备 、tty 设备 、 网 络 设备 等 ， 因 此 ，USB 设备 驱 
动 中 也 必须 实现 符合 相应 框架 的 代码 。 
USB 设备 驱动 的 自身 设备 驱动 部 分 的 读 写 等 操作 流程 有 其 特殊 性 ， 即 以 URB 来 贯穿 始终 ， 
一 个 URB 的 生命 周期 通常 包含 创建 、 初 始 化 、 提 交 ， 和 被 USB 核心 及 USB 主机 传递 及 完成 后 回 
调 函 数 被 调用 的 过 程 ， 当 然 ， 在 URB 被 驱动 提交 后 ， 也 可 以 被 取消 。 

在 UDC 和 gadget M, UDC 关心 底层 的 硬件 操作 ， 而 gadget 驱动 则 只 是 利用 通 


ECEN 


过 usb request 与 底层 UDC 驱动 交互 。 



























































































































































用 的 API， 透 























a re AAA A——————— — 
USE T DII A I RIA TI La RR. Danai B. RT A a a ra Fat Mn Y 3a t me II 




















PCI 总 线 在 一 般 的 小 型 手持 设备 中 不 太 可 能 用 到 ， 但 是 在 工控 和 通信 
设备 及 其 PC 中 却 引领 着 潮流 。 在 Linux 系统 中 ，PCI 设备 驱动 和 USB 设 
备 驱动 有 共性 , 那 就 是 其 驱动 都 由 总 线 相关 部 分 和 自身 设备 类 型 驱动 两 部 







































































分 组 成 。 
















































































中 的 数据 结构 。 





21.1 节 讲 解 了 PCI 总 线 及 其 配置 空间 





给 出 了 PCI 总 线 在 Linux 内 核 











PCI 设备 驱动 的 PCI 相关 部 分 围绕 着 pei driver 结构 体 的 成 员 函 数 展 























开 ，21.2 节 讲 解 了 pci driver 结构 体 及 其 
设备 驱动 的 框架 结构 。 














成 员 函 数 的 含义 ， 并 分 析 了 PCI 
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21 0 1 PCI 总 线 与 配置 空间 


21.1.4 PCI 总 线 的 Linux 描述 
PCI 是 CPU 和 外 围 设 备 通 信 的 高 速 传 输 总 线 。PCI 规范 能 够 实现 32 位 并 行 数据 传输 ， 工 作 


频率 为 33MHz 或 66MHz， 最 大 吞吐 率 达 266MB/s. PCI 的 衍 4 


















































PCI-Express, cPCI 等 。 

从 本 书 第 2 章 的 图 2.16 可 以 看 出 ，PCI 总 线 体 系 结构 是 一 种 层次 式 的 体系 结构 。 在 这 种 层 
次 式 体 系 结构 中 ，PCI 桥 设 备 占 据 着 重要 的 地 位 ， 它 将 父 总 线 与 子 总 线 连接 在 一 起 ， 从 而 使 整 
个 系统 看 起 来 像 一 颗 倒置 的 树 型 结构 。 树 的 顶端 是 系统 的 CPU， 它 通过 一 个 较为 特殊 的 PCI 桥 


设备 






























































E 物 包括 CardBus, mini-PCI, 





























Host/PCI 桥 设 备 与 根 PCI 总 线 连接 起 来 。 








作为 一 种 特殊 的 PCI 设备 ，PCI 桥 包 括 以 下 几 种 。 
@ 


在 Linux 系统 中 ，PCI 总 线 








Host/PCI 桥 : 用 于 连接 CPU 与 PCI 根 总 线 ， 第 1 个 根 总 线 的 编 
































me 























蕊 片 组 (North Bridge Chipset)”. 


























号 为 0。 在 PC 中 ， 内 存 











空 制 器 也 通常 被 集成 到 Hos PCI 桥 设备 芯片 中 ， 因 此 ，HostPCI 桥 通常 也 被 称 为 “北桥 

















PCIISA Wr: 用 于 连接 旧 的 ISA 总 线 。 通 常 ，PCI 中 的 类 似 18359A 中 断 控 制 器 这 样 的 设 






































PERRA 
Bridge Chipset)”. 








T 




















成 到 PCIISA 桥 设 备 中 ， 因 此 ，PCUISA 桥 通常 也 被 称 为 “ 南 桥 芯片 组 CSouth 


PCI-to-PCI 桥 : 用 于 连接 PCI 主 总 线 (primary bus). 与 次 总 线 (secondary bus). PCI 桥 
所 处 的 PCI 总 线 称 为 “ 主 总 线 ”( 即 次 总 线 的 父 总 线 )， 桥 设备 所 连接 的 PCI 总 线 称 为 “次 























总 线 ”( 即 主 总 线 的 子 总 线 )。 





























] pci bus 来 描述 ， 这 个 结构 体 记录 了 本 PCI 总 线 的 信息 以 及 本 


PCI 总 线 的 父 总 线 、 子 总 线 、 桥 设备 信息 ， 这 个 结构 体 的 定义 如 代码 清单 21.1 所 示 。 





Os PT COT oW cà ho FE ES 




















代码 清单 21.1 pci bus 结构 体 


GhEdewWeus, peN ob dd 
struct list head node; /* 链表 元 素 nodqe */ 


struct pci bus *parent; /* 指 向 该 PCI 总 线 的 父 总 线 ， 即 PCI 桥 所 在 的 总 线 */ 
struct list head children; /* 描述 了 这 条 PCI 总 线 的 子 总 线 链表 的 表 头 */ 





struct list head devices; /* 描述 了 这 条 PCI 总 线 的 逻辑 设备 链表 的 
struct pci dev *self; /* 指向 引出 这 条 PCI 总 线 的 桥 设 备 的 pci_gdev 
struct resource *resource[PCI BUS NUM RESOURCES]; 

/* 指向 应 路 由 到 这 条 PCI 总 线 的 地 址 空间 资源 */ 















































struct pci ops *ops; /* 这 条 PCI 总 线 所 使 用 的 配置 空间 访问 函数 */ 
void *sysdata; /* 指向 系统 特定 的 扩展 数据 */ 
struct proc dir entry *procdir;/* 该 PCI 总 线 在 /proc/pus/pci H 














unsigned char number; /* 这 条 PCI 总 线 的 总 线 编号 */ 
unsigned char primary; /* 桥 设 备 的 主 总 线 */ 
unsigned char secondary; /* PCI 总 线 的 桥 设备 的 次 总 线 号 */ 








AG */ 
结构 */ 





对 应 的 目录 项 */ 





unsigned char subordinate; /*PCI 总 线 的 下 属 PCI 总 线 的 总 线 编号 最 大 值 */ 








PCI 设备 驱动 


db) char name[48]; 


ODO 


Zu unsigned short bridge ctl; 

22 pci bus flags t bus flags; 

23 struct device *bridge; 

24 struct class device class dev; 

Z5. hesewieie. bin taten bute ey 

26 struct bin attribute *legacy mem; 
28 unsigned int is added:1; 
PICS 


假定 一 个 如 图 21.1 所 示 的 PCI 总 线 系统 ， 根 总 线 0 上 有 一 个 PCI 桥 ， 它 引出 子 总 线 Bus 1, 
Bus 1 上 又 有 一 个 PCI 桥 引出 Bus 2. 
Bus 0 Bus2 












































PCIPCI 桥 
Primary-l 


PCIPCI 桥 
Primary—0 
Secondary-2 

Subordinate-2 


Secondary-l 
Subordinate-2 





Bus 1 








21.1 示例 PCI 总 线 系 统 














在 上 图 中 ，Bus 0 总 线 的 pei bus 结构 体 中 的 number, primary. secondary 都 应 该 为 0， 因为 
它 是 通过 Host/PCI 桥 引出 的 根 总 线 ;， Bus 1 总 线 的 pei bus 结构 体 中 的 number 和 secondary 都 为 1， 
但 是 它 的 primary 应 该 为 0， Bus 2 总 线 的 pci bus 结构 体 中 的 number 和 secondary 都 应 该 为 2， 而 
其 primary 则 应 该 等 于 1。 这 3 条 总 线 的 subordinate 值 都 应 该 等 于 2。 

系统 中 当前 存在 的 所 有 根 总 线 都 通过 其 pei bus 结构 体 中 的 node 成 员 链接 成 一 条 全 局 的 根 总 
REK, HRALA list 类 型 的 全 局 变量 pei root buses 来 描述 。 而 根 总 线 下 面 的 所 有 下 级 总 线 则 都 
通过 其 pci_bus 结构 体 中 的 node 成 员 链接 到 其 父 总 线 的 children 链表 中 。 这 样 ， 通 过 这 两 种 PCI 
总 线 链表 ，Linux 内 核 就 将 所 有 的 pei bus 结构 体 以 一 种 倒置 树 的 方式 组 织 起 来 。 假 定 对 于 如 图 21.2 
所 示 的 多 根 PCI 总 线 体系 结构 ， 它 所 对 应 的 总 线 链 表 结 构 将 如 图 21.3 所 示 。 
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21.2 多 根 PCI 总 线 体系 结构 
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21.8 PCI 总线 链表 


21.1.2. PCI 设备 的 Linux 描述 
在 Linux 系统 中 ， 所 有 种 类 的 PCI 设备 都 可 以 用 pci_derv 结构 体 来 描述 ， 由 于 一 个 PCI 接口 
卡 上 可 能 包含 多 个 功能 模块 ， 每 个 功能 被 当 作 一 个 独立 的 逻辑 设备 ， 因 此 ， 每 一 个 PCI 功能 ， 即 
PCI 逻辑 设备 都 惟一 地 对 应 一 个 pei dev 设备 描述 符 ， 该 结构 体 的 定义 如 代码 清单 21.2 所 示 。 
代码 清单 21.2 pci dev 结构 体 





















































































































































1 struct pci dev ( 
2 struct list head bus list; 
3 struct pci bus *bus; /* 这 个 PCI 设备 所 在 的 PCI 总 线 的 pci_ bus 结构 */ 
4 struct pci bus *subordinate; /* 指向 这 个 PCI 设备 所 桥接 的 下 级 总 线 */ 
5 
6 void *sysdata; /* 指向 一 片 特定 于 系统 的 扩展 数据 */ 
7 struct proc dir entry *procent; /* iZ PCI 设备 在 /proc/bus/pci 中 对 应 的 目录 项 */ 
8 struct pci slot *slot; /* 设备 位 于 的 物理 插 槽 */ 
9 unsigned int devfn; /* 这 个 PCI 设备 的 设备 功能 号 */ 
0 unsigned short vendor; /* PCI 设备 的 厂商 ID*/ 
1 unsigned short device; /* PCI 设备 的 设备 ID */ 
2 unsigned short subsystem vendor; /* PCI 设备 的 子 系统 厂商 ID */ 
3 unsigned short subsystem device; /* PCI 设备 的 子 系统 设备 ID */ 
4 unsigned int class ; /* 32 位 的 无 符号 整数 ， 表 示 该 PCI 设备 的 类 别 ， 
8 bit [7:0] AmE, bit [15:8] 为 子 类 别 代码 ，DiE [23:16] 
6 Wn pit [31:24] Z5XE X. */ 
7 u8 hdr type; /* PCI 配置 空间 头 部 的 类 型 */ 
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18  u8 pcie type; /* PCI-E 设备 /端口 类 型 */ 

19 u8 rom base reg; /* 表示 PCI 配置 空间 中 的 ROM 基地 址 寄存 器 在 PCI 配置 空间 中 的 位 置 */ 
20  u8 pin; /* 中 断 引 脚 */ 

21 struct pci driver *driver; /* 指向 这 个 PCI 设备 所 对 应 的 驱动 pci_qdriver 结构 */ 
22 u64 dma mask; /* 该 设备 支持 的 总 线 地 址 位 掩 码 ， 通 常 是 0xffffffff */ 

23 struct device_dma_parameters dma_parms; 

24 pci power t current state; /* 当前 的 操作 状态 */ 

25 abge pm cap; 

26 unsigned int pme support:5; 

27 unsigned int dl support:1; /* 支持 low power 状态 D1 ? */ 

28 unsigned int d2 support:1; /* 支持 low power 状态 D2? */ 

29 unsigned int no dig32:1; /* 仅 允 许 DO 和 D3 ? */ 

30 pci channel state t error state; 

31 struct device dev; /* 通用 的 设备 接口 */ 

32 int cfg size; /* 配置 空间 大 小 */ 

93 

34 unsigned int irqg; 

35 struct resource resource[DEVICE COUNT RESOURCE]; 

36 /* 表 示 该 设备 可 能 用 到 的 资源 ， 包 括 : 

37 I/0 端口 区 域 、 设 备 内 存 地 址 区 域 以 及 扩展 ROM 地 址 区 域 */ 

38 

39 unsigned int transparent: 1; /* XH] Pcr Wr? */ 

40 unsigned int multifunction: 1; /* 多 功能 设备 ? */ 

Al  /* 跟踪 设备 状态 */ 

42 unsigned int is_added:1; 

43 unsigned int is busmaster: 1; /* 设备 是 主 设备 ? */ 

44 unsigned int no msi: 1; /* 设备 可 不 使 用 msi? */ 

45 unsigned int block ucfg access:1; /* 不 允许 用 户 空间 访问 配置 空间 ? */ 
46 sis 

47  u32 saved config space[16]; /* 挂 起 时 保存 的 配置 空间 */ 

48 struct bin attribute *rom attr; /* sysfs ROM 入口 的 属性 描述 */ 

49 int rom attr enabled; 

50 struct bin attribute *res attr[DEVICE COUNT RESOURCE]; /* 资 源 的 sysfs 文件 */ 
Sui ede 

32 jg 


21.1.3 PCI 配置 空间 访问 

PCI 有 3 种 地 址 空间 : PCI VO 空间 、PCI 内 存 地 址 空间 和 PCI 配置 空间 。CPU 可 以 访问 所 有 
的 地 址 空间 ， 其 中 PCI IO 空间 和 PCI 内 存 地 址 空间 由 设备 驱动 程序 使 用 。PCI 支持 自动 配置 设 
f$. 与 旧 的 ISA 驱动 程序 不 一 样 ，PCI 驱动 程序 不 需要 实现 复杂 的 检测 逻辑 。 启 动 时 ，BIOS 或 内 
核 自 身 会 各 历 PCI 总 线 并 分 配 资源 ， 如 中 断 优先 级 和 LO 基 址 。 设 备 驱动 程序 通过 PCI 配置 空间 
来 找到 资源 分 配 情况 。 
PCI 规范 定义 了 3 种 类 型 的 PCI 配置 空间 头 部 ， 其 中 type 0 用 于 标准 的 PCI 设备 ，type 1 
于 PCI Pt, type 2 用 于 PCI CardBus 桥 。 如 图 2.17 所 示 ， 不 管 是 哪 一 种 类 型 的 配置 空间 头 部 ， 其 
前 16 个 字 节 的 格式 都 是 相同 的 ，/include/linux/pci regs.h 文件 中 定义 了 PCI 配置 空间 头 部 ， 如 代 
码 清单 21.3 所 示 。 
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代码 清单 21.3 PCI 配置 空间 头 部 寄存 器 定义 


#define PCI VENDOR ID 0x00 /* 164r] Bü ID */ 
#define PCI DEVICE ID 0x02 /* 16 位 设备 ID */ 


/* PCI 命令 寄存 器 */ 
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5 #define PCI COMMAND 0x04 /* 16 f% */ 

6 #define PCI COMMAND IO 0x1 /* 使 能 设备 啊 应 对 r/o 空间 的 访问 */ 

7 #define PCI COMMAND MEMORY 0x2 /* 使 能 设备 响应 对 存储 空间 的 访问 */ 

8 4define PCI COMMAND MASTER 0x4 /* 使 能 总 线 主 模式 */ 

9 #define PCI COMMAND SPECIAL 0x8 /* 使 能 设备 响应 特殊 周期 */ 
0 #define PCI COMMAND INVALIDATE 0x10 /* 使 用 PCI 内 存 写 无 效 事 务 */ 
1 #define PCI COMMAND VGA PALETTE 0x20  /* 使 能 VGA 调 色 板 侦 测 */ 
2 #define PCI COMMAND PARITY 0x40 /* 使 能 奇偶 校 验 */ 

3 #define PCI COMMAND WAIT 0x80 /* 使 能 地 址 /数据 步 进 */ 
4 #define PCI COMMAND SERR 0x100  /* 使 能 SERR */ 

5 #define PCI COMMAND FAST BACK 0x200 /* 使 能 背靠背 写 */ 
6 #define PCI COMMAND INTX DISABLE 0x400 /* 禁止 中 断 竞 争 */ 
7 

8 /* PCI 状态 寄存 器 */ 

9 &define PCI STATUS 0x06  /* 1614 */ 

20 4define PCI STATUS CAP LIST 0x10 /* 文 持 的 能 力 列表 */ 

21 #define PCI STATUS 66MHz 0x20 /* 支持 PCI 2.1 66MHz */ 

22 4define PCI STATUS UDF 0x40 /* 支持 用 户 定义 的 特征 */ 

23 #define PCI STATUS FAST BACK 0x80 /* 快速 背靠背 操作 */ 

24 #define PCI STATUS PARITY 0xi100  /* 侦 测 到 奇偶 校 验 错 */ 

25 #define PCI STATUS DEVSEL MASK 0x600  /* DEVSEL 定时 */ 

26 4define PCI STATUS DEVSEL FAST 0x000 

27 4define PCI STATUS DEVSEL MEDIUM 0x200 

28 4define PCI STATUS DEVSEL SLOW 0x400 

29 &define PCI STATUS SIG TARGET ABORT 0x800 /* 目标 设备 异常 */ 

30 4define PCI STATUS REC TARGET ABORT 0x1000 /* 主 设备 确认 */ 

31 4define PCI STATUS REC MASTER ABORT 0x2000 /* 主 设备 异常 */ 

32 4$define PCI STATUS SIG SYSTEM ERROR 0x4000 /* 驱动 了 SERR */ 

33 4define PCI STATUS DETECTED PARITY 0x8000 /* 奇偶 校 验 错 */ 

34 

35 /* 类 代码 寄存 器 和 修订 版 本 寄存 器 */ 

36 #define PCI CLASS REVISION 0x08 /* 高 24 位 为 类 码 ， 低 8 位 为 修订 版 本 */ 

37 &define PCI REVISION ID 0x08 /* 修订 号 */ 

38 #define PCI CLASS PROG 0x09 /* 编程 所 i 

39 &define PCI CLASS DEVICE 0x0a /* 设备 类 */ 

40 £define PCI CACHE LINE SIZE 0x0c /* 8h */ 

41 £define PCI LATENCY TIMER 0x0d /* 8 位 */ 

42 

43 /* PCI3KOEES */ 

44 #define PCI HEADER TYPE 0x0e /* 8 位 头 类 型 */ 

45 #define PCI HEADER TYPE NORMAL 0 

46 4define PCI HEADER TYPE BRIDGE i 

47 4define PCI HEADER TYPE CARDBUS 2 

48 

49 /* 表示 配置 空间 头 部 中 的 Built-In Self-Test 寄存 器 在 配置 空间 中 的 字 节 地 址 索引 */ 

50 £define PCI BIST 0x0f [t 9 M */ 

51 £define PCI BIST CODE MASK 0x0f [a re BANI 

52 4define PCI BIST START 0x40 /* 用 于 启动 BIST*/ 

53 #define PCI BIST CAPABLE 0x80 /* 设备 是 否 支 持 BIST? */ 














紧 接 着 前 16 个 字 节 的 寄存 器 为 基地 址 寄存 器 0 一 基地 址 寄存 器 $， 
2 一 $ 仅 对 标准 PCI 设备 的 0 类 型 配置 空间 头 部 有 意义 ， 而 PCIL_ BASE ADDRESS 0-1 则 适用 于 




































































0 类 型 和 1 类 型 配置 空间 头 部 。 


基地 址 寄存 器 中 的 bit [0] 的 值 六 


其 中 , PCI BASE ADDRESS 


I 














定 了 这 个 基地 址 寄存 器 所 指定 的 地 址 范围 是 在 IO 空间 还 
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是 在 内 存 映 射 空 间 内 进行 译 码 。 当 基地 址 寄存 器 所 指定 的 地 址 范围 位 于 内 存 映 射 空间 中 时 ， 其 bit 
[2:1] 表示 内 存 地 址 的 类 型 ，bit [3] 表示 内 存 范围 是 否 为 可 预 取 (Prefetchable) 的 内 存 。 

1 类 型 配置 空间 头 部 适用 于 PCI-PCI 桥 设 备 ， 其 基地 址 寄存 器 0 与 基地 址 寄存 器 1 可 以 用 来 
指定 桥 设备 本 身 可 能 要 用 到 的 地 址 范围 ， 而 后 40 个 字 节 COx18—0x39) 则 被 用 来 配置 桥 设 备 的 主 、 
次 编号 以 及 地 址 过 滤 窗 口 等 信息 。 

pci bus 结构 体 中 的 pei ops 类 型 成 员 指 针 ops 指向 该 PCI 总 线 所 使 用 的 配置 空间 访问 操作 的 
LESKI, pci ops 结构 体 的 定义 如 代码 清单 21.4 所 示 。 
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代码 清单 21.4 pci ops 结构 体 
LE Seer TS HO TOS 
2 int (*read) (struct pci_bus *bus, unsigned int devfn, int where, int size, u32 
3 *val);/* EMAZ */ 
4 int(*write) (struct pci bus *bus, unsigned int devfn, int where, int size, u32 
5) 
6 








seb). Jf Suae su) 
}; 

read) fll write0) 成 员 函 数 中 的 size 表示 访问 的 是 字 节 、2 字 节 还 是 4 字 节 ， 对 于 write0) 而 言 ， 
val 是 要 写 入 的 值 ; 对 于 read0 而 言 ，val 是 要 返回 的 读 取 到 的 值 的 指针 。 通 过 bus. 参数 的 成 员 以 及 
devfn 可 以 定位 相应 PCI 总 线 上 相应 PCI 逻辑 设备 的 配置 空间 。 在 Linux 设备 驱动 中 ， 可 用 如 下 
一 组 函数 来 访问 配置 空间 : 

inline int pci read config byte(struct pci dev *dev, int where, u8 *val); 

inline int pci read config word(struct pci dev *dev, int where, ul6 *val); 

inline int pci read config dword(struct pci dev *dev, int where, u32 *val); 

inline int pci write config byte(struct pci dev *dev, int where, u8 val); 


inline int pci write config word(struct pci dev *dev, int where, ul6 val); 
inline int pci write config dword(struct pci dev *dev, int where, u32 val); 
上 述 函 数 只 是 对 如 下 函数 进行 调用 : 

int pci bus read config byte (struct pci bus *bus, unsigned int devfn, int where, u8 *val); 
/* 读 字 节 */ 

int pci bus read config word (struct pci bus *bus, unsigned int devfn, int where, ul6 
*val); /* RF */ 

int pci bus read config dword (struct pci bus *bus, unsigned int devfn, int where, u32 
*val); /* EXE */ 

int pci bus write config byte (struct pci bus *bus, unsigned int devfn, int where, u8 
wedle e se t] an 

int pci bus write config word (struct pci bus *bus, unsigned int devfn, int where, nig 
val); /* S5 */ 

int pci bus write config dword (struct pci bus *bus, unsigned int devfn, int where, u32 
val); /* 写 双 字 */ 

最 后 ， 我 们 来 看 一 下 PCI 总 线 、 设 备 与 驱动 在 /proc 和 /sysfs 文件 系统 中 的 描述 。 首 先 ， 通 过 
查看 /proc/bus/pci 中 的 文件 ， 可 以 获得 系统 连接 的 PCI 设备 的 基本 信息 描述 。 在 本 书 配 套 虚拟 机 
Linux 上 的 /proc/bus/pci 目录 下 的 树 型 结构 如 下 : 

/proc/bus/pci 

| 04) 

| c 8. 
| == Qu s 
| == d. 
| == (02. 
| = 
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1 
1 
C 
o 
€ "C CE uS x 


^-- devices 





11 files 
sysfs 文件 系统 /sys/bus/pci H RFEA E TA 
树 型 结构 如 下 : 


/Sys/bus/pci 


directory, 








-- devices 

sec D DDO DU DU. 
Sa DDODO COD S Od 
2cc0000:00201, 
es DD DO UP 
cec 0000:00:03; 
-- 0000:00:04. 
2c 0000:00:05. 
tu DODUSDUTD5. 
xU Ue Ue. 
en c DDUD DOSE 
-- drivers 
Time e TICH 


ee (9 (ex e» e» 4e e» 1e ce» es) 
l 


[== omot 

|-- module > ../. 
|-- new id 

|-- uevent 

me sm 


Ecc 


IIl 
|== mocme — es/a 
|-- new id 


|-- uevent 





el 


-- drivers autoprobe 
-- drivers probe 





cc: Eos 
^-- uevent 


89 directories, 239 files 





Eug messe a a ee e a ES SS 


I 53010.0 0110/0105 e Ne 


152280010 05:50 01:100 0 ce 























此 外 ，pciutils (PCI TH) 














查看 系统 中 PCI 设备 的 描述 信息 ， 
00:00.0 Host bridge: Intel 
00:01.0 ISA bridge: 
00:01.1 IDE interface: 
00:02.0 VGA compatible controller: 
Adapter 


00:03.0 Ethernet controller: Advanced Micro Devices [AMD] 79c970 [PCnet32 LANCE] 


ds ccc es ys m e es 


sd e 


sd s 





的 lspci 工具 





ntel Corporation 82371AB/EB/MB PIIX4 IDE 


























总 线 上 挂 接 的 设备 及 驱动 信息 , 该 目录 下 的 








00/0000:00:00. 
00/0000:00:01. 
00/0000:00:01. 
00/0000:00:02. 
00/0000:00:03. 
:00/0000:00:04. 
00/0000:00:05. 
00/0000:00:06. 
00/0000:00:07. 
00/0000:00:0Db. 


evices/pci0000: 
evices/pci0000: 
evices/pci0000: 
evices/pci0000: 
evices/pci0000: 
evices/pci0000 
evices/pci0000: 
evices/pci0000: 
evices/pci0000: 


cC CE C X X Ky EY ge x x 


evices/pci0000: 


./../../devices/pci0000:00/0000:00:05.0 


./../../module/snd intel8x0 


ed «4. ./devices/pciO0000:00/0000:00:03.0 


./../../module/pcnet32 






































分 析 /proc/bus/pci 中 的 文件 ， 从 而 可 被 














例如 在 本 书 配套 虚拟 机 上 运行 lspci 的 结果 为 : 


Corporation 440FX - 82441FX PMC 





[Natoma] (rev 02) 


Intel Corporation 82371SB PIIX3 ISA [Natoma/Triton II] 


Coe 
InnoTek Systemberatung GmbH VirtualBox Graphics 


(rev 
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00:04.0 System peripheral: InnoTek Systemberatung GmbH VirtualBox Guest Service 

00:05.0 Multimedia audio controller: Intel Corporation 82801AA AC'97 Audio Controller 
(rev 01) 

00:06.0 USB Controller: Apple Computer Inc. KeyLargo/Intrepid USB 

00:07.0 Bridge: Intel Corporation 82371AB/EB/MB PIIXA4 ACPI (rev 08) 

00:0b.0 USB Controller: Intel Corporation 82801FB/FBM/FR/FW/FRW (ICH6 Family) USB2 EHCI 
Controller 


21.1.4 PCI DMA 相关 的 API 

内 核 中 定义 了 一 组 专门 针对 PCI 设备 的 DMA 操作 接口 ， 这 些 API 的 原型 和 作用 与 第 11 章 介 
绍 的 通用 DMA API 非常 相似 ， 主 要 包括 如 下 。 

e 设置 DMA 缓冲 区 掩 码 。 

int pci set dma mask(struct pci dev *dev, u64 mask); 

e — Sit DMA 缓冲 区 分 配 /释放 。 


void *pci alloc consistent(struct pci dev *pdev, size t size, dma addr t *dma handle); 






















































































void pci free consistent(struct pci dev *hwdev, size t size, void *vaddr, dma addr t 
dma handle); 


€ n DMA 缓冲 区 映射 /去 映射 。 


dma addr t pci map single(struct pci dev *pdev, void *ptr, size t size, int direction); 














int pci map sg(struct pci dev *pdev,struct scatterlist *sgl,int num entries, int 
direction); 


void pci unmap single(struct pci dev  *pdev, dma addr t dma addr, size t size, 
abge. xolibveexetsa n oio) 2 


void pci unmap sg(struct pci dev *pdev, struct scatterlist *sg, int Menten int 
direction); 


这 些 API 的 用 法 与 第 11 APNA dma alloc consistent), dma map single(). dma map sg() 
相似 ， 只 是 以 pci 开头 的 API 用 于 PCI 设备 驱动 。 


21.1.5 PCI 设备 驱动 其 他 常用 API 
除了 DMA API 外 ， 在 PCI 设备 驱动 中 其 他 常用 的 函数 (或 宏 ) 如 下 所 示 。 
e ”获取 10 或 内 存 资源 。 



















































































#define pci resource start (dev,bar) ((dev)Sresource[(bar)].start) 
ddefine pci resource end (dev,bar) ((dev)Sresource[(bar)].end) 
ddefine pci resource flags (dev,bar) ((dev)Sresource[.(bar)].flags) 
ddefine pci resource len(dev,bar) \ 
((pci resource start((dev), (bar)) == 0 && N 
pci resource end((dev), (bar)) == N 
pci resource start((dev),(bar))) ? O : N 
N 
(pci resource end((dev), (bar)) - \ 


pei resource start((dev), (bar)) -* 1) 
e ”申请 /释放 UO 或 内 存 资 源 。 


int pci request regions (struct pci dev *pdev, const char *res name); 














void pci release regions (struct pci dev *pdev); 


e ”获取 /设置 驱动 私有 数据 。 
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void *pci get drvdata (struct pci dev *pdev); 
void pci set drvdata (struct pci dev *pdev, void *data); 


e ”使 能 /禁止 PCI 设备 。 


int pci enable device lve pci dev *dev); 





void pci disable device(struct pci dev *dev); 

e 设置 为 总 线 主 DMA。 

void pci set master(struct pci dev *dev); 

e 寻找 指定 总 线 指定 槽 位 的 PCI 设备 。 

struct pci dev *pci find slot (unsigned int bus, unsigned int devfn); 
e 设置 PCI 能 量 管理 状态 (0=D0... 3=D3 )。 

int pci set power state(struct pci dev *dev, pci power t state); 
e 在 设备 的 能 力 表 中 找 出 指定 的 能 

int pci find capability (struct pci dev *dev, int cap); 

e 启用 设备 内 存 写 无 效 事务 。 

int pci set mwi(struct pci dev *dev); 

e 禁用 设备 内 存 写 无 效 事务 。 


void pci clear mwi(struct pci dev *dev); 









































































































































21.2 ocius 


21.2.1 PCI 设备 驱动 的 组 成 

从 本 质 上 讲 PCI 只 是 一 种 总 线 ， 有 具体 的 PCI 设备 可 以 是 字符 设备 、 网 络 设备 、USB XU 
器 等 ， 因 此 ， 一 个 通过 PCI 总 线 与 系统 连接 的 设备 的 驱动 至 少 包含 以 下 两 部 分 内 容 。 

€ PCI 驱动 。 

e 设备 本 身 的 驱动 。 

PCI 驱动 只 是 为 了 辅助 设备 本 身 的 驱动 ， 它 不 是 目的 ， 而 是 手段 。 例 如 ， 对 于 通过 PCI 总 线 
与 系统 连接 的 字符 设备 ， 则 驱动 中 除了 要 实现 PCI 驱动 部 分 外 ， 其 主体 仍然 是 设备 作为 字符 设备 
本 身 的 驱动 ， 即 实现 file operations 成 员 函 数 并 注册 cdev。 分 析 Linux 内 核 可 知 ， 在 /drivers/block/、 
/drivers/atm/ ~ /drivers/char/ 、 /drivers/i2c/ 、 /drivers/ieee1394/、 /drivers/media/ 、 /drivers/mtd/ ~ 
/drivers/net/、/drivers/serial/、/drivers/video/、/sound/ 等 目录 中 均 广泛 分 布 着 PCI 设备 驱动 。 

在 Linux 内 核 中 ， 用 pci driver 结构 体 来 定义 PCI 驱动 ， 该 结构 体 中 包含 了 PCI 设备 的 探测 / 
移 除 、 挂 起 /恢复 等 函数 ， 其 定义 如 代码 清单 21.5 Br. pei driver 和 前 面 说 的 platform driver. 
i2c_driver、usb_driver 的 地 位 非常 相似 ， 都 是 起 到 挂 接 总 线 的 作用 。 


代码 清单 21.5 pci driver 结构 体 
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Sue nn i el 
struct list head node; 
char *name; 




















const struct pci device id *id table; /* 不 能 为 NULL， 以 便 probe 函数 调用 */ 
/* 新 设备 添加 */ 


Jb 
2 
B 
4 struct module *owner; 
5 
6 
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ODO 





7 int(*probe) (struct pci dev *dev, const struct pci device id *id); 
8 void(*remove) (struct pci dev *dev); /* 设备 移出 */ 
9 int(*suspend) (struct pci dev *dev, pm message t state); /* 设备 挂 起 */ 
0 int (*suspend late) (struct pci dev *dev, pm message t state); 
1 int (*resume early) (struct pci dev *dev); 
2  int(*resume) (struct pci dev *dev); /* 设备 唤醒 */ 
3  void(*shutdown) (struct pci dev *dev); 
4 struct pm ext ops *pm; 
5 struct pci_error_handlers *err_handler; 
6 struct device_driver driver; 
7 esee ue (obses 
Sj Jg 














对 pci driver 的 注册 和 注销 通过 如 下 函数 来 实现 : 


int pci register driver(struct pci driver *driver); 

















void pci unregister driver(struct pci driver *drv); 

pci driver 的 probe() KACE T PCI 设备 的 初始 化 及 其 设备 本 身 身份 (字符 、TTY、 网 络 等 ) 
驱动 的 注册 。 当 Linux 内 核 启动 并 完成 对 所 有 PCI 设备 进行 扫描 、 登 录 和 分 配 资源 等 初始 化 操作 
的 同时 ， 会 建立 起 系统 中 所 有 PCI 设备 的 拓扑 结构 ，probeO 函 数 将 负责 硬件 的 探测 工作 并 保存 配 
置信 息 。 

下 面 以 一 个 PCI 接口 字符 设备 为 例 ， 给 出 PCI 设备 驱动 的 完整 模板 。 其 一 部 分 代码 实现 pci_driver 
成 员 函 数 ， 一 部 分 代码 实现 字符 设备 的 file operations 成 员 函 数 ， 如 代码 清单 21.6 所 示 。 


代码 清单 21.6 ”PCI 设备 驱动 的 程序 模板 
/* 指明 该 驱动 程序 适用 于 哪 一 些 PCI 设备 */ 
(he nol kele OXe be OLS el > leo | ly eele hee = 
(PCI VENDOR ID DEMO, PCI DEVICE ID DEMO, 
PCI ANY ID, PCI ANY ID, O0, 0, DEMO), 
(0,) 









































































































































; 
MODULE DEVICE TABLE(pci, xxx pci tbl); 


KC O00 ON OR ou og. NO ES 





/* 中 断 处 理 函 数 */ 
static void xxx interrupt(int irq, void *dev id, struct pt regs *regs) 


{ 


/* 字符 设备 file_operations open 成 员 函 数 */ 
static int xxx open(struct inode *inode, struct file *file) 


{ 














/* 申请 中 断 ， 注 册 中 断 处 理 程序 */ 


9 request ENEI InG OXXX wbskue ew, 555)) 7 




















23 /* 字符 设备 file operations ioctl 成 员 函 数 */ 
24 static int xxx ioctl(struct inode *inode, struct file *file, unsigned int cmd, unsigned long arg) 
2 ON 
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29 /* 字符 设备 file operations read. write. mmap ERRA% */ 
30 
31 /* 设备 文件 操作 接口 */ 


32 static struct file operations xxx fops - ( 



















































































33 owner: THIS MODULE, /* xxx fops 所 属 的 设备 模块 */ 
34 read: xxx read, /* 读 设备 操作 */ 

35 write: xxx write, /* Ss dE 

36 ioctl: xxx ioctl, /* 控制 设备 操作 */ 

37 mmap: xxx_mmap, /* 内 存 重 映射 操作 */ 

38 open: XXX open, /* 打开 设备 操作 */ 

39 release: xxx_release /* 释放 设备 操作 */ 

40 ); 

41 

42 /* pci driver 的 probe Win A% */ 

43 static int | init xxx probe (struct pci dev *pci dev, const struct pci device id *pci id) 
44 { 

45 pci enable device(pci dev); /* 启动 PCI 设备 */ 

46 

47 /* iH Pcr 配置 信息 */ 

48 iobase = pci resource start (pci dev,1); 

49 

50 

51 pci set master (pci_dev);// 设 置 成 总 线 主 DMA 模式 

52 

53 pci request regions (pci dev);/* 申请 I/0 资源 */ 

54 

55 /* 注册 字符 设备 */ 

56 cdev init(xxx cdev,&xxx fops); 

3r register chrdev region(xxx dev no, 1, ...); 

58 cdev add(xxx cdev); 

59 

60 Petcu nnno 

61 ) 

62 

63 /* pci driver 的 remove WRA% */ 

64 static int _ init xxx release(struct pci dev *pdev) 

Gb M 

66 pci release regions (pdev);/* 释放 工 /0 资源 */ 

67 pci disable device (pdev);/* 禁止 PCI 设备 */ 

68 unregister chrdev region(xxx dev no, 1); /* 释放 占用 的 设备 号 */ 
69 cdev del(&xxx dev.cdev); /* 注销 字符 设备 */ 

70 

TH return 0; 

152 

"sj 

74 /* 设备 模块 信息 */ 

7S statie  SCEUCE Gre driver Xxx CI vr = | 

76 name: xxx MODULE NAME, /* 设备 模块 名 称 */ 
VY vel taglas coor oei coly /* 能 够 驱动 的 设备 列表 */ 
78 probe: xxx probe, /* 查找 并 初始 化 设备 */ 
79 remove: XXX remove /* REKATE */ 
GO yr 

81 

daratatue Ane tndt re rnit Module Ayora) 

831 
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ODO 


84 pci register driver(&xxx pci driver); 

GS p 

86 static void _ exit xxx cleanup module (void) 
o 4 

88 pci unregister driver(&xxx pci driver); 
89 


] 
90 /* 驱 动 模块 加 载 函 数 */ 
91 module init(xxx init module); 
92 /* RIRE RR */ 


93 module exit(xxx cleanup module); 

上 述 代码 清单 的 第 17 行 给 出 了 本 驱动 所 文 持 的 PCI 设备 的 列表 ， 如 同 在 USB 设备 驱动 中 
定义 usb device id 结构 体 数 组 一 样 , 在 PCI 设备 驱动 中 , 也 需要 定义 一 个 pci_device_id 结构 体 数 
组 。pci_device_ id 用 于 标识 一 个 PCI 设备 。 它 的 成 员 包 括 : 厂商 ID、 设 备 ID、 子 厂商 ID、 子 设 
ZID, Xal Xa ETIKE, FX) 和 私有 数据 。 每 一 个 PCI 设备 的 驱动 程序 都 有 
个 pci device id 的 数组 ， 用 于 告诉 PCI 核心 自己 能 够 驱动 哪些 设备 ，pci_device id 结构 体 的 定义 
如 代码 清单 21.7 所 示 。 
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代码 清单 21.7 pci device id 结构 体 


struct pci device id ( 








2 ..u32 vendor, device; /* 厂商 和 设备 IDA2XPCI ANY ID*/ 

3 ..u32 subvendor, subdevice;  /* f] fjIDEZXPCI ANY ID */ 

4 ”2 elass, Class masky ye ES SS oi mH v// 
5 kernel ulong t driver data; /* 驱动 私有 数据 */ 

ONE 

将 代码 清单 21.6 中 的 各 个 函数 进行 归 类 ， 可 得 出 该 驱动 的 组 成 ， 如 图 21.4 所 示 。 





















































模块 加 载 与 MEPE a= 
i pci_driver 成 员 








xxx init module() : xxx probe(): PCI 设 备 初 
始 化 ， 注 册 字 符 设 备 
xxx remove(): PCI 设 备 


释放 ， 注 销 字符 设备 








注册 pci_driver 
xxx cleanup module(): 












注销 pci_driver 















xxx open() 
xxx release() 
xxx ioctl() 
xxx read() 
xxx write() 






字符 设备 file operations 







21.4 PCI 字符 设备 驱动 的 组 成 
























































图 21.5 所 示 的 树 中 ， 树 根 是 主机 /PCI 桥 ， 树 叶 是 具体 的 PCI 设备 ， 树 叶 本 身 与 树枝 通过 
pci driver 连接 ， 而 树叶 本 身 的 驱动 ， 读 写 、 控 制 树叶 则 需要 通过 其 树叶 设备 本 身 所 属 类 设备 驱动 














此 我 们 看 出 ， 对 于 USB. PCI 设备 这 种 挂 接 在 总 线 上 的 设备 而 言 ， USB、PCI 只 是 它们 的 
“工作 单位 ”它们 需要 向 “工作 单位 ”注册 (注册 usb_driver、pci_driver)， 并 接收 “工作 单位 ” 
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的 管理 (被 调 入 probe0、 调 出 disconnectO/remove()、 放 假 suspend()/shutdown(). 245: EIE resume() 
等 )， 但 是 其 本 身 可 能 是 一 个 工程 师 、 一 个 前 台 或 一 个 经 理 ， 因 此 ， 做 好 工程 师 、 前 台 或 经 理 是 其 
主体 工作 ， 这 部 分 对 应 于 字符 设备 驱动 、tty 设备 驱动 、 网 络 设 备 驱动 等 。 
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21.5 PCI 设备 驱动 的 组 成 


21.2.2 ”实例 : PCI 骨架 程序 


drivers/net/pci-skeleton.c 给 出 了 一 个 PCI 接口 网 络 设备 驱动 程序 的 “骨架 ” 其 pei driver 中 






































probe0 成 员 函 数 netdrv_init one0O 及 其 调用 的 netdrv_init board0 完 成 了 PCI 设备 初始 化 及 对 应 的 网 
络 设备 注册 工作 ， 代 码 清单 21.8 所 示 为 这 两 个 函数 的 实现 。 


代码 清单 21.8 pci-skeleton 设备 驱动 的 probe() 函 数 


static int ^ devinit netdrv init one (struct pci dev *pdev, 











const struct pci device id *ent) 





struct net device *dewv - NULL. 
struct netdrv private *tp; 


i = netdrv init board (pdev, &dev, &ioaddr); 


NFORCE CUN SEI CO SS) 


devoopen = netdrv open; 

devohard start xmit = netdrv start xmit; 
devostop = netdrv close; 

devoset multicast list - netdrv set rx mode; 
devodo ioctl = netdrv ioctl; 

devotx timeout = netdrv tx timeout; 
devowatchdog timeo = TX TIMEOUT; 


devoirq = pdev irg; 





S$G- OO E oy, Un 3e meo bo de rcx 


devobase addr = (unsigned long) ioaddr; 
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20 

21 tp = netdev priv (dev); 

22 

UE EE 

24 pci_set_drvdata (pdev, dev); 

25 

26 return 0; 

2S 

28 

29 static int | devinit netdrv init board (struct pci dev *pdev, 


OQO 


30 Struct net device **dev out, 
Si void **ioaddn-out) 

22-1 

SIS E 

34 dev = alloc etherdev (sizeof (*tp)); 

35 if (dev == NULL) { 

36 dev err(&pdevodev, "unable to alloc new ethernet An"); 
eyi DPRINTK ("EXIT, returning -ENOMEM Nn"); 

38 return -ENOMEM; 

Sec 

40 SET NETDEV DEV (dev, &pdevodev); 

41 tp = netdev priv (dev); 

2 EP s 

43 ] 


从 上 述 代 码 可 以 看 出 ，probe0 函 数 中 进行 了 网 络 设 备 的 初始 化 和 注册 。pci_driver 的 remove 
成 员 函 数 完成 相反 的 工作 ， 即 注销 网 络 设备 ， 如 代码 清单 21.9 所 示 。 
代码 清单 21.9 ”pci-skeleton 设备 驱动 的 remove() 函 数 
static void | devexit netdrv remove one (struct pci dev *pdev) 


( 
struct net device *dev - pci get drvdata (pdev); 


















































struct netdrv private *np; 


np = netdev priv (dev); 
assert (np !- NULL); 


O 00. M Ov 0 (Qo RS LC 


0  unregister netdev (dev); 
ib 

2 €*ifindef USE 10 OPS 

3  iounmap (npommio addr); 
VD HE SETTORE OD OSA 
5 
6 
jl 
8 


pci release regions (pdev); 


free netdev (dev); 





20 pci set drvdata (pdev, NULL); 
22 pci disable device (pdev); 


224 DEREN ETENN NE 
25 


/drivers/net/pci-skeleton.c 中 定义 的 pei device id 结构 体 数 组 及 MODULE DEVICE TABLE 
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导出 代码 如 清单 21.10 所 示 。 








代码 清单 21.10 PCI 设备 驱动 的 pci_device id 数组 及 MODULE DEVICE TABLE 


Misrat lne tr rae 

2 下 人 二 DEC O00 PCLANYOID;  FPOT-ANY dO, OF Or Jet Lek) Fy 

3 Ost cM BL PCE-ANY TD PEL ANY TD OO NETDRVICR F 

4 OBIT (O12 PET AN ID, PCI AN iD O7 O Swei2iim p. 

$ Je (gd. (QT. Teu Aw A5, Jeu xwv iub Or. (i. Juie»xXSY Lov 
6 (0x1500, 0x1360, PCI ANY ID, PCI ANY ID, 0, 0, DELTA8139 ], 

7) TOLAS URTSU, POE ANT- 1D) POT ANY LTD O 07- ADDIRONS TOO E7 

8 107 J; 

Sr rg 


10 MODULE DEVICE TABLE (pci, netdrv pci tb); 
除 此 之 外 ，pci-skeleton 的 主体 即 是 完成 网 络 设备 驱动 相关 的 工作 ， 完 全 符合 本 
的 模板 。 


d 
d 
CN 
T 























PCI 设备 驱动 只 是 字符 设备 、tty 设备 、 网 络 设备 、 音 频 设 备 等 与 系统 的 一 个 接口 ， 因 此 ， 豫 
动 将 由 两 部 分 组 成 ， 一 部 分 是 PCI 相关 部 分 ， 另 一 部 分 是 设备 本 身 所 属 类 驱动 。PCI 驱动 的 核心 
数据 结构 是 pci driver, TE probe0 成 员 函 数 中 将 申请 资源 并 注册 对 应 的 字符 设备 、tty 设备 、 网 络 
设备 、 音 频 设 备 等 ， 而 remove0 成 员 函 数 中 将 释放 资源 并 注销 对 应 的 字符 设备 、tty 设备 、 网 络 设 
备 、 音 频 设备 等 。 
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调试 ， 建 立民 好 的 开发 环境 很 
































具 软 件 以 及 掌握 常用 的 调试 技巧 等 。 








22.1 节 介 绍 Linux H 


TAS. 


事 ， 必 先 利 其 器 ”， 为 了 方便 进行 Linux wAY 
要 ， 包 括 实 验 室 环境 建设 、 使 用 必要 的 工 


























F 发 环境 的 建设 ， 包 括 实验 室 配置 、] 











22.2 节 讲 解 了 Linux 下 调试 器 gdb 的 基本 用 法 和 技巧 。 
22.3 节 讲 解 了 Linux 内 核 的 调试 方法 ，22.4 一 22.9 节 对 22.3 节 的 概述 





展开 讲解 ， 分 别 讲解 了 Linux 内 核 调 试 有 
工具 ，kcore、kdb 和 kgdb， 以 及 使 用 仿真 器 进行 调试 的 方法 。 
22.10 节 讲 解 了 Linux 应 用 程序 的 调试 方法 













































































写 用 户 空 间 的 应 用 程序 对 
用 程序 调试 方法 对 驱动 工程 师 而 言 也 是 必须 的 。 
VEI Linux 和 常用 的 一 些 稳定 性 、 
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月 到 的 printk(). /proc. oops. I 


区 动 的 开发 和 

















， 了 驱动 工程师 往往 需要 纺 



































性 能 分 析 和 调 


ULT 

















写 的 驱动 进行 验证 和 测试 ， 因 此 ， 掌 握 应 
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22. TELLS 


22.4.1 实验 室 建设 


























在 公司 或 学 校 的 实验 室 中 ，PC 的 性 能 一 般 来 说 不 会 太 高 ， 用 PC 来 编译 Linux 内 核 和 模块 的 
速度 总 是 受 限 。 相 反 地 ， 服 务 器 的 资源 相对 比较 充分 ，CPU 以 及 磁盘 性 能 都 较 高 ， 因 此 在 服务 器 
























































上 进行 内 核 、 驱 动 及 应 用 程序 的 编译 开发 都 将 更 加 快捷 ， 
内 的 所 有 开发 者 。 图 22.1 所 示 为 一 种 常见 的 小 型 Linux 实验 室 环境 。 
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Linux 


GDB, GCC, 9 Linux 





Samba. sshd E. 1M mount NFS 
X : 0000 
NFS: 存放 目标 板 “您 角 
服务 器 应 用 程序 Pi 
A 1 
| "Uy A P4 
: Windows. / 
SSH / 
1 / 
1 / 
M Windows. i 
N SSH / 


22.4 Linux 实验 室 环境 


而 且 使 用 服务 器 更 便于 统一 管理 实验 室 


Linux 服务 器 上 启动 了 Samba 和 sshd 进程 ,各 工程 师 在 自己 的 Windows 或 Linux 客户 机 上 









































































































































复制 文件 。 































































































通过 SSH 用 自己 的 用 户 名 和 密码 登录 服务 器 便 可 以 使 用 服务 器 上 的 GCC、GDB 等 软件 
(Windows F SSH Secure Shell 界面 如 图 22.2 所 示 )。 同 时 ，SSH 软件 提供 了 类 似 于 FTP 的 文件 
taje (Windows F SSH Secure File Transfer 界面 如 图 22.3 所 示 ), 方便 在 客户 端 和 服务 器 端 


目标 板 、 服 务 器 和 客户 端 全 部 通过 交换 机 连接 ， 同 时 客户 端 连接 目标 板 的 串口 作为 控制 
在 调试 Linux 应 用 程序 时 ， 目 标 板 erver 与 调试 用 的 GDB， 目 标 板 与 服务 器 的 NFS 挂 接 都 借助 网 





人 
Lo 





络 通 信和 解决 。 编 写 完成 的 应 用 程序 或 内 核 模块 可 直接 存放 在 服务 器 的 NFS 服务 目录 内 ,而 该 目录 
































可 被 目标 板 上 的 Linux 系统 mount 到 本 身 的 一 个 目录 内 。 
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全 192.168.1.21 - default - SSH Secure Shell i - [el x| 


File Edit View Window Help 











|ua ss reela SANER 


zl Quick Connect | ] Profiles 











SSH Secure Shell 3.2.9 (Build 283) 
Copyright (c) 2000-2003 SSH Communications Security Corp - http: //wmn;.ssh.com/ 


This copy of SSH Secure Shell is a non-commercial version. 
This version does not include PKI and PKCS #11 functionality. 


Last login: Wed Jul 11 00:11:16 2007 
[rootBlocalhost root]# 








Connected to 192,168.1.21 [SSH2 -aesi28-cbc-hmacmdS-none [80x24 | | T2 





22.2 SSH Secure Shell 





fili 2:192.168.1.21 - default - SSH Secure File Transfer 





|| Ele Edt view Operation Window Help 
[es 3e sn ®%]s t |El 


Il g Quick Connect |] Profiles | 


[im | a e | e x Piee] naa | m | 6 Ga | ek o Sers aa 





s Oo ew 
























Local Name + | Size | Type | Modified | Remote Name 7| Size | Type 

[C] globalmem.c 5,443 C Source... 2007-07- | 6] book.c 1,304 CSource... 

[€] alobalmem test.c 3,833 CSource,.. 2007-07- | S book.ko 111,872 KO 文件 20t 
le] book.mod.c 825 CSource,,, 20C 
[Ed] book.mod.o 55,744 OTi 20€ 
[Es] book.o 56,792 Oft 20€ 
加 export.c 621 C Source... 20€ 
[E export.ko 110,184 KO 文件 20t 
[C] export.mod.c 523 CSource... 20C 
[E] export.mod.o 55144 OXft 20t 
[s export.o 56211 OX 20t 
ie] globalmem.c 5,443 CSource... 20€ 
[Es] globalmem.ko 154,332 KO 文件 20€ 
加 globalmem.mod.c 1,010 CSource... 20C 
Ir) aloh almam mad n se nan oirik ox Xl 

«| | Gi K » 








Transfer | Queue | 








d | Source File | Source Directory | Destination Directory. | Size | Status | Speed Time 
4t globalmem,C DBackup\ 我 的 文档 \,,， jdriver_study 5,443 Complete 26.8kB/s 00:00:00 
T globalmem_test,c ”DBackup' 我 的 文档 \,,， Jdriver study 3,833 Complete 35.2kBjs 00:00:00 











Connected to 192.168.1.21 - Jdriver. study [55H2 - aes128-cbc - hmac-md5 - none 23 items (1.0 MB) [| EA z 














22.3 SSH Secure File Transfer 


22.412 I B4 

为 了 编译 、 连 接 并 调试 Linux 应 用 程序 和 内 核 , 我 们 首先 需要 建立 针对 目标 板 处 理 器 的 GNU 
工具 链 。 

GNU 工具 链 有 力 地 支撑 了 Linux 系统 的 发 展 ， 由 于 它 可 被 看 作 许 多 和 峙 入 式 处 理 器 的 一 个 交叉 
编译 器 ， 所 以 在 代入 式 软件 开发 中 相当 流行 ， 其 支持 包括 ARM, StrongARM, XScale, PowerPC, 
MIPS, 68K/ColdFire, Intel x86/IA-32、Intel i960、Hitachi SH 在 内 的 多 种 体系 结构 。GNU 工具 链 
中 大 多 数 有 用 的 工具 主要 集中 于 以 下 几 个 源 代码 包 中 。 
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GCC 包 ， 主 要 包括 gcc (C 编译 器 )、g++ (C++ 编译 器 )、cpp (C 预 处 理 器 )。 
€ Binutils (binary utilities) 包 ， 主 要 包括 as〈 汇 编程 序 )、ld (连接 器 )、objcopy〔 目 标 文件 

翻译 器 ， 用 于 从 连接 器 输出 中 创建 一 个 ROM 映像 )、objdump “目标 文件 阅读 器 ， 用 于 

反 汇 编目 标 文件 )。 
€ ”glibc/uclibc/newlib， 提 供 系 统 调用 和 基本 函数 的 C 库 ， 比 如 open0、malloc0、PprintfO 等 。 
Make， 主 要 包括 make 工具 。 

Debugger， 主 要 包括 gdb 〈 源 代码 调试 器 )。 

上 述 源 代码 包 都 可 以 从 gnu FTP 站 点 上 直接 下 载 ， 如 为 了 建立 ARM Linux 的 GNU 工具 链 ， 
我 们 需 下 载 newlib. binutils, gcc 和 gdb 代码 包 。 在 解压 缩 、 针 对 特定 处 理 器 配置 、 编 译 并 安装 
这 样 软 件 包 后 ， 便 可 以 使 用 它们 进行 交叉 编译 与 开发 。 配 置 、 编 译 与 安装 的 所 需 执 行 的 命令 步 又 
如 下 : 





eo 










































































































































































































































































(1)cd [binutils-build] 
(2) [bànutils-source]/configure --target-arm-elf --prefix-[toolchain-prefix] --enable- 





interwork --enable-multilib 

(3)make all install 

(4)export PATH-"$PATH:[toolchain-prefix]/bin" 

(eye el ene one 

(6) [gcc-source]/configure --target-arm-elf --prefix-[toolchain-prefix] --enable-interwork -- 
enable-multilib --enable-languages-"c,c44" --with-newlib --with-headers- [newlib-source]/newlib/ 
libc/include 

(7)make all-gcc install-gcc 

(8)cd [newlib-build] 

(9) [newlib-source]/configure --target-arm-elf --prefix-[toolchain-prefix] --enable- 
interwork--enable-multilib 

(10)make all install 

(11)ed [gcc-build] 

(12)make all install 
G ECE Todos dg 
(14) [gdb-source]/configure --target-arm-elf --prefix-[toolchain-prefix] --enable-inter 


work --enable-multilib 
(15)make all install 


当 使 用 交叉 编译 器 的 时 候 ， 程 序 通常 用 前 绥 来 指示 目标 的 体系 结构 和 连接 器 的 输 
arm-linux-gcc、arm-linux-gdb、powerpc-linux-gcc 等 。 
建立 交叉 工具 链 的 过 程 相当 繁琐 ， 我 们 不 必 亲 自 操作 ， 可 以 直接 下 载 第 三 方 编译 好 了 的 、 开 
放 的 、 针 对 目标 处 理 器 的 交叉 工具 链 ， 如 在 http://www.codesourcery.com/gnu_toolchains/ 上 可 以 下 
载 针 对 ARM、ColdFire 和 Power 的 工具 链 。 


本 书 配套 光盘 提供 的 VirtualBox 虚拟 机 映像 中 ， 已 经 包含 了 制作 好 的 arm-linux-gec 等 。 


22.1.3 ”串口 工具 
ERAR Linux 的 调试 过 程 
在 80% 以 上 的 情况 下 都 是 通过 
的 生产 效率 。 

在 Windows 环境 下 ， 甚 附件 内 上 自 带 了 超级 终端 ， 超 级 终端 包括 了 对 VT100、ANSI 等 终端 仿 
真 功 能 以 及 对 xmodem、ymodem、zmodem 等 协议 的 支持 ， 如 图 22.4 所 示 。 














出 格式 ， 如 
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"er. Up TFE 
具 将 大 大 提高 工程 师 
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中 ， 目 标 机 往往 会 提供 给 主机 一 个 串口 
口 与 目标 机 通信 。 因 此 ， 好 用 的 串口 工 
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coal 115200 一 — 





x mA v tt 3 E 3 zie 
osel oae o o 





/var# rz 


? x«B00000012f&áced 


文件 夹 : 


rz ready. Type "sz file ..." 


CE :4 


Xa 


." to your modem program 


E:N 





Bc 


[eso 


bsp 





[znoden 


xc | xao | mm | 











[EE 0:34:51 |vr1007 





115200 8-N-1 [SCRC 





Bu [cs "mm T 

















224 超级 终端 











在 调试 过 程 中 ， 经 常 需要 保存 
下 的 “捕获 文字 ”功能 来 实现 。 
























































串口 打印 信息 的 历史 记录 ， 这 时 候 可 以 使 用 “传送 ” 菜 间 























SecureCRT 是 比 超级 终端 更 强大 且 更 方便 的 工具 ， 











ET SSH 的 安全 登录 、 数 据 传 送 性 能 和 

































































SecureCRT 


Windows 终端 仿真 提供 的 可 靠 性 、 可 
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] 性 和 可 配置 性 结合 在 一 起 ， 其 界面 如 图 22.5 所 示 。 鉴 于 




















\ 备 比 超级 终端 更 强大 且 好 用 的 功能 ， 建 议 直接 用 SecureCRT 蔡 代 超 级 终端 。 








1E Serial-COM3 - SecureCRT 














-inl xl 
File Edi View op ansfer Script Tools Help 
39038] eQ 3 TEE Z 
eea "B 








在 开发 过 程 中 ， 为 执行 自动 化 的 
让 其 运行 一 段 脚 本 ， 
所 示 的 有 














自动 捕获 接收 到 的 串 








[Serial: COM3 


[1, 23 [24Rows, 80 Cols |vr100 


22.5 SecureCRT 





和 口 发 送 操作 ， 














可 以 使 用 SecureCRT 的 VBScript 脚本 功能 ， 
串口 信息 并 向 串口 上 发 送 指定 的 数据 或 文件 。 代 码 清单 22.1 



























































“y/n” 时 ， 选择 "y", 











等 待 接收 到 “CCC” 字 符 串 后 通过 xmodem 协议 发 送 filebin 文件 ， 之 后 ， 当 接收 到 
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代码 清单 22.1 SecureCRT VBScript 脚本 范例 


1 4$1anguage - "VBScript" 

2. ME c» Vi ou 

3 

4 Sub main 

5 Dir = "d:\baohua\" 

6 ' turn on synchronous mode so we don't miss any data 
gi crt.Screen.Synchronous = True 

8 'wait "CCC" string then send file 


9 crt.Screen.WaitForString "CCC" 

10 crt.FileTransfer.SendXmodem Dir & "file.bin" 
a 'wait "y/n" string then send "y" 

12 crt.Screen.WaitForString "y/n" 

13 crt.Screen.Send "y" & VbCr 

14 End Sub 


男 外 ， 在 Windows 下 环境 下 ， 也 可 以 选用 PuTTY 工具 ， 该 工具 非常 小 巧 ， 功 能 很 强大 ， 文 
H, Telnet 和 SSH 等 ， 其 官方 网 址 为 : http://www.chiark.greenend.org.uk/~sgtatham/putty/。 

Minicom 是 Linux 系统 下 常用 的 类 似 于 Windows 下 超级 终端 的 工具 ， 当 要 发 送 文件 或 设置 虽 
时 ， 需 完 按 下 “CTRL+A”， 紧 接着 按 下 “Z” 键 激活 菜单 ， 如 图 22.6 所 示 。 
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pun 



























































elcome to minicom 2.88.8 
图 Minicom Command Summary 


Commands can be called by CTRL-A «key» 
Main Functions Dther Functions 
Dialing directory..D run script (Go). 
SODE LLIE aaa S Receive files. 


comm Parameters fidd linefeed 
Capture on/off. 


i Clear Screen 

i cünfigure Minicom.. 
A i Suspend minicom.... 

Hangup ..H i eXit and reset 

i Quit with no reset.t 

i Cursor key mode....I 

t Help sergen. 

i scroll Back 


run Kermit.. 
local Echo or 


Terminal settings.. 
lineWrap on/off.... 


E 
.L 
send break .F initialize Modem... 
T 
W 


Select function or press Enter for none. _ 


Written by Miquel van Smoorenburg 1991-1995 
Some additions by Jukka Lahtinen 1997-2000 
ii8n by Arnaldo Carvalho de Melo 1998 





图 22.6 Minicom 


























除了 Minicom 以 外 ， 在 Linux 系统 下 ， 也 可 以 直接 使 用 C-Kermit。 运 行 kermit 命令 即 可 启动 


C-Kermit。 在 使 用 C-Kermit 连接 目标 板 之 前 ， 需 先进 行 串口 设置 ， 如 下 所 示 : 
set line /dev/ttyS0 
set speed 115200 
set carrier-watch off 

































































Set handshake none 
set flow-control none 
robust 

set file type bin 

set file name lit 

set rec pack 1000 

set send pack 1000 
set window 5 
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后， 使 用 以 下 命令 就 可 以 连接 到 目标 板 : 

connect 

在 kermit 的 使 用 过 程 中 ， 会 涉及 串口 控制 台 和 kermit 功能 模式 之 间 的 切换 ， 从 串口 控制 台 切 
换 到 kermit 的 方法 是 按 下 “Ctrl+\”， 然 后 再 按 下 “C”。 
假设 我 们 在 串口 控制 台 上 敲 入 命令 使 得 目标 板 进 入 文件 接收 等 待 状态 ， 此 后 可 按 下 “Ctrl +\”， 
再 按 “C”， 切换 到 kermit， 运 行 “send /file name” 命 令 传 输 文 件 。 文 件 传输 结束 后 ， 再 运行 “c” 
命令 将 进入 串口 控制 台 。 





















































































































































-be ims 
22.2.1 GDB 基本 用 法 


GDB 是 GNU 开源 组 织 发 布 的 一 个 强大 的 UNIX 下 的 程序 调试 工具 ，GDB 主要 可 帮助 工程 师 
完成 下 面 4 个 方面 的 功能 。 
@ 启动 程序 ， 可 以 按照 工程 师 自 定义 的 要 求 运 行程 序 。 
e 让 被 调试 的 程序 在 工程 师 指定 的 断 点 处 停 住 ， 断 点 可 以 是 条 件 表达 式 。 
e 当 程 序 被 停 住 时 ， 可 以 检查 此 时 程序 中 所 发 生 的 事 ， 并 追踪 上 文 。 
@ 动态 地 改变 程序 的 执行 环境 。 
是 调试 Linux 内 核 空间 的 驱动 还 是 调试 用 户 空 间 的 应 用 程序 ， 掌 握 GDB 的 用 法 都 是 
必须 。 而 且 ， 调 试 内 核 和 调试 应 用 程序 时 使 用 的 GDB 命令 是 完全 相同 的 ， 下 面 以 代码 清单 22.2 
的 应 用 程序 为 例 演 示 GDB 调试 器 的 用 法 。 
代码 清单 22.2 GDB 调试 演示 程序 
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nt adat LE ls angue dol) 

2T 

3 return a -* b; 

A o 

5 

6 main() 

T o3 

8 int sum[10] = 

si { 

0 Quo ore Oro Ou 0 TOS COO 
1 } 

2 aBoNE. aL 

3 

4 int arrayl[10] - 

5 

6 LS. SIS. Ia. Skis 3  didbrs 122r api, qiieiue S0] 
qj ; 

8 int array2[10] - 

9 

20 SG 99,5 (Go xdi 5/995. Jd. d 25. S. dl 
Zt 2 
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23 Por (3. — Quee st cm dE AE 
24 { 
2 sum[i] - add(arrayl[i], array2[i]); 












































T 











使 用 命令 “gcc -g gdb example.c —o gdb_example” 编 译 上 述 程序 ， 得 到 包含 调试 信息 的 二 进 


牛 example， 执 行 “gdb gdb_example” 命 令 进入 调试 状态 ， 如 下 所 示 : 
[root@localhost driver study]# gdb gdb example 

GNU gdb Red Hat Linux (5.3post-0.20021129.18rh) 

Copyright 2003 Free Software Foundation, Inc. 



































GDB is free software, covered by the GNU General Public License, and you are 
welcome to change it and/or distribute copies of it under certain conditions. 
Type "show copying" to see the conditions. 

There is absolutely no warranty for GDB. Type "show warranty" for details. 
This GDB was configured as "i386-redhat-linux-gnu"... 

(gdb) 


1. list 命令 
在 GDB 中 运行 list MS CA; D 可 以 列 出 代码 ，list 的 具体 形式 如 下 。 
目的 源 程序 ， 如 下 所 示 : 












































Imi 














€ list <linenum>， 显 示 程 序 第 linenum 17 f] 
(gdb) list 15 














int arrayl[10] - 
{ 

aan 505 Ty. 3S SS dd. 2205 2M. TO € 
) 
int array2[10] - 
{ 

GIOPMEOIOPMEG GNE SIRO ol PME UT 
}; 


COS ODE ME CH bs SC MY DT NL 








€ list <function> ， 显 示 函 数 名 为 function 的 函数 的 源 程序 ， 如 下 所 示 : 





gdb) list main 











( 

2 { 

3 return a -* b; 

al } 

5 

6 main () 

X { 

8 int sum[10]; 

G ag ut 

1O 

3L 3L aom eurae k 0] = 
@ list， 显 示 当 前 行 后 面 的 源 程序 。 

















— > 


© list -， 显 示 当 前 行 前 面 的 源 程 序 。 
下 面 演示 了 使 用 GDB 中 的 run (HSA r), break (缩写 为 b)、next HSN n) 命令 控 币 
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运行 ， 并 使 用 print (缩写 为 p) 命令 打印 程序 中 的 变量 sum 的 过 程 ， 
(gdb) break add 
Breakpoint 1 at 0x80482f7: file gdb example.c, line 3. 
(gdb) run 
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Starting program: /driver study/gdb example 


Breakpoint 1, add (a-48, b-85) at gdb example.c:3 


warning: Source file is more recent than executable. 


3 Te vel 4r ep 

(gdb) next 

4 } 

(gdb) next 

main () at gdb example.c:23 

23 iie (ab e poat o d Gum) 

(gdb) next 

25 sum[i] - add(arrayl[i], array2[i]); 


(gdb) print sum 
而 和 
2. run 命令 
Æ GDB 中 ， 运 行程 序 使 用 run 命令 。 在 程序 运行 前 ， 我 们 可 以 设置 如 下 4 方面 的 工作 环境 。 
(OD 程序 运行 参数 。 
“set args” 可 指定 运行 时 参数 ， 如 :“set args 10 20 30 40 50"; “show args” 命 令 可 以 查看 设置 
好 的 运行 参数 。 
(2) 运行 环境 。 
“path <dir>” 可 设 定 程 序 的 运行 路 径 ;“how paths” 可 查看 程序 的 运行 路 径 ;“set environment 
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varname [=value]” 用 于 设置 环境 变量 ， 如 “set env USER-baohua"; “show environment [varname] 
则 用 于 查看 环境 变量 。 
(3) 工作 目录 。 
“cd <dir>” 相 当 于 shell 的 cd 命令 ，pwd 显示 当前 所 在 的 目录 。 
(4) 程序 的 输入 输出 
“info terminal” 用 于 显示 程序 用 到 的 终端 的 模式 ; GDB 中 也 可 以 使 用 重 定 向 控制 程序 输出 
如 “run > outfile” tty 命令 可 以 指定 输入 输出 的 终端 设备 ， 如 : tty /dev/ttyS1。 
3. break 命令 
在 GDB 中 用 break 命令 来 设置 断 点 ， 设 置 断 点 的 方法 如 下 。 
(1) break <function>。 
在 进入 指定 函数 时 停 住 ，C1 
指定 函数 名 。 


(2) break <linenum>。 
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可 以 使 用 “class::function ”或 “function(type，type)” 格 式 来 


pq 


在 指定 行 号 停 住 。 
(32 break +offset / break - offset. 

在 当前 行 号 的 前 面 或 后 面 的 offset 行 停 住 ，offiset 为 自然 数 。 
(4) break filename:linenum. 

在 源 文件 filename 的 linenum 行 处 停 住 。 

(5) break filename:function. 

在 源 文件 filename 的 function 函数 的 入 口 处 停 住 。 
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(6) break *address. 

TE FEFE3S 1T B5] PLE Ho kb E 

(7) break. 

break 命令 没有 参数 时 ， 表 示 在 下 一 条 指令 处 停 住 

(8) break ++: if «condition». 

“…” 可 以 是 上 述 的 “break <linenum>”, “break +offset / break -offset” 中 的 参数 ，condition 
表示 条 件 ， 在 条 件 成 立时 停 住 。 比 如 在 循环 体 中 ， 可 以 设置 “break 这 二 100”， 表 示 当 i 7g 100 时 
停 住 程序 。 
查看 断 点 时 ， 可 使 用 info 命令 ， 如 “info breakpoints [n] ". “info break [n]" (n 表示 断 点 号 )。 
4. 单 步 命令 
在 调试 过 程 中 ，next 命令 用 于 单 步 执行 ， 类 似 于 VC++ 中 的 step over. next 的 单 步 不 会 进入 
函数 的 内 部 ， 与 next 对 应 的 step ASA s) 命令 则 在 单 步 执行 一 个 函数 时 ， 会 进入 其 内 部 ， 类 
似 于 VC++ 中 的 step into。 下 面 演 示 了 step 命令 的 执行 情况 ， 在 第 23 行 的 add0 函 数 调用 处 执行 
step 会 进入 其 内 部 的 “return a*b;" 1&4): 


(gdb) break 25 
Breakpoint 1 at 0x8048362: file gdb example.c, line 25. 


eo 


FH 


o 
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(gdb) run 
Starting program: /driver study/gdb example 


Breakpoint 1, main () at gdb example.c:25 

28 sum[i] - add(arrayl[i], array2[i]); 
(gdb) step 

add (a=48, b-85) at gdb example.c:3 

B return a -* b; 


单 步 执行 的 更 复杂 用 法 如 下 。 
(1) step «count». 
单 步 跟踪 ， 如 果 有 函数 调用 ， 则 进入 该 函数 〈 进 入 函数 的 前 提 是 ， 此 函数 被 编译 有 debug 信息 )。 
step 后 面 不 加 count 表示 一 条 条 地 执行 ， 加 count 表示 执行 后 面 的 count 条 指令 ， 然 后 再 停 住 。 

(2) next «count». 
单 步 跟踪 ， 如 果 有 函数 调用 ， 它 不 会 进入 该 函数 。 同 样 地 ，next 后 面 不 加 count 表示 一 条 条 
地 执行 ， 加 count 表示 执行 后 面 的 count 条 指令 ， 然 后 再 停 住 。 

(3) set step-mode. 

"set step-mode on” 用 于 打开 step-mode 模式 ， 这 样 ， 在 进行 单 步 跟 踪 时 ， 程 序 不 会 因为 没有 
debug 信息 而 不 停 住 ， 这 个 参数 的 设置 可 便于 查看 机 器 码 。“set step-mod off” 用 于 关闭 step-mode 
模式 。 

(4) finish. 

运行 程序 ， 直 到 当前 函数 完成 返回 ， 并 打印 函数 返回 时 的 堆栈 地 址 和 返回 值 及 参数 值 等 信 




































































































































































































































































































































































(5) until (缩写 为 u)。 
直 在 循环 体内 执行 单 步 ， 退 不 出 来 是 一 件 令 人 烦恼 的 事情 ，until 命令 可 以 运行 程序 直到 退 
出 循环 体 。 
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(6) stepi〈 缩 写 为 si) 和 nexti (缩写 为 ni)。 

stepi 和 nexti 用 于 单 步 跟踪 一 条 机 器 指令 ， 一 条 程序 代码 有 可 能 由 数 条 机 器 指令 完成 ，stepi 
I| nexti 可 以 单 步 执行 机 器 指令 。 
另外 ， 运 行 “displayi $pc” 命 令 后 ， 单 步 跟 踪 会 在 打出 程序 代码 的 同时 打出 机 器 指令 ， 即 汇 
编 代 码 。 

5. continue 命令 

当 程 序 被 停 住 后 ， 可 以 使 用 continue áp CAR 573 c. fg 命令 同 continue 命令 ) 恢复 程序 的 
运行 直到 程序 结束 ， 或 到 达 下 一 个 断 点 ， 命 令 格 式 为 ; 


continue [ignore-count] 
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c [ignore-count] 


fg [ignore-count] 

ignore-count 表示 忽略 其 后 多 少 次 断 点 。 

假设 我 们 设置 了 函数 断 点 add0， 并 watch i， 则 在 continue 过 程 中 ， 每 次 遇 到 add() 函 数 或 i 
发 生变 化 ， 程 序 就 会 停 住 ， 如 下 所 示 : 


(gdb) continue 

















iH 





























Continuing. 
Hardware watchpoint 3: i 


Old value = 2 

New value - 3 

0x0804838d in main () at gdb example.c:23 
23 EGE ALOS OC A a Gt 

(gdb) continue 


Continulng. 


Breakpoint 1, main () at gdb example.c:25 

25 umida aval kis eben 
(gdb) continue 

Continuing. 

Hardware watchpoint 3: i 


Old value - 3 

New value = 4 

0x0804838d in main () at gdb example.c:23 

23 för- (ab = 0 V e dOr IRE) 

6. print 命令 

在 调试 程序 时 ， 当 程序 被 停 住 时 ， 可 以 使 用 print 命令 (缩写 为 p)， 或 是 同 义 命令 inspect 来 
查看 当前 程序 的 运行 数据 。print 命令 的 格式 如 下 : 


print «expr» 















































Prints IN po 


<expr> 是 表达 式 ， 是 被 调试 的 程序 中 的 表达 式 ，< 仑 是 输出 的 格式 ， 比 如 ， 如 果 要 把 表达 式 # 
十 六 进 制 的 格式 输出 ， 那 么 就 是 x。 在 表达 式 中 ， 有 几 种 GDB 所 支持 的 操作 符 ， 它 们 可 以 用 在 人 
何 一 种 语言 中 ,“@” 是 一 个 和 数组 有 关 的 操作 符 ,“::” 指 定 一 个 在 文件 或 是 函数 中 的 变量 ,“ {<type>} 
<addr>” 表 示 一 个 指向 内 存 地 址 <addr> 的 类 型 为 type 的 一 个 对 象 。 

下 面 演 示 了 查看 sum[] 数 组 的 值 的 过 程 : 





T 
































Tr 





























































































































574 INUX 





Linux 设备 驱动 的 调试 e 


eo 


(gdb) print sum 
$2 2 (133, 155, 0, 0, 0, 0, 0, 0, O, O) 


(gdb) next 

Breakpoint 1, main () at gdb example.c:25 

25 sum[i] » add(arrayl[i], array2[i]); 
(gdb) next 

2/9 ine (iab — (Qe. sb ee dip. LRE) 


(gdb) print sum 
$3 2 (133, 155, 143, O, O, O, O, O, O, O0) 


当 需 要 查看 一 段 连续 内 存 空间 的 值 的 时 间 ， 可 以 使 用 GDB 的 “@” 操 作 符 ,“@” 的 左边 是 
第 一 个 内 存 地 址 ,，“@” 的 右边 则 是 想 查 看 内 存 的 长 度 。 例 如 如 下 动态 申请 的 内 存 : 

Me ee nr ty Webbe db eu ee m DE 

在 GDB 调试 过 程 中 这 样 显示 出 这 个 动态 数组 的 值 : 

p *array@len 

print 的 输出 格式 如 下 。 
x: 按 十 六 进 制 格式 显示 变量 。 
di 按 十 进 制 格式 显示 变量 。 
u: 按 十 六 进 制 格式 显示 无 符号 整 型 。 
o 
t 


















































































































































: 按 八进制 格式 显示 变量 。 

: 按 二 进 制 格式 显示 变量 。 
a: 按 十 六 进 制 格式 显示 变量 
c: 按 字符 格式 显示 变量 。 
f: 按 浮 点 数 格式 显示 变量 。 
门 可 用 display 命令 设置 一 些 自动 显示 的 变量 ， 当 程序 停 住 时 ， 或 是 单 步 跟 踪 时 ， 这 些 变量 
显示 。 


[0 果 要 修改 变量 ， 如 x 的 值 ， 可 使 用 如 下 命令 : 


rint x=4 


GDB 的 print 查看 程序 运行 时 的 数据 时 ， 每 一 个 print 都 会 被 GDB 记录 下 来 。 GDB 会 以 
$1, $2, $3 … 这 样 的 方式 为 每 一 个 print 命令 编号 。 我 们 可 以 使 用 这 个 编号 访问 以 前 的 表达 式 ， 
如 $1。 

7. watch 命令 

watch 一 般 来 观察 某 个 表达 式 〈 变 量 也 是 一 种 表达 式 ) 的 值 是 否 有 变化 了 ， 如 果 有 变化 ， 马 
上 停止 程序 运行 。 我 们 有 如 下 几 种 方法 来 设置 观察 点 。 

watch <expr>: 为 表达 式 〈 变 量 ) expr 设置 一 个 观察 点 。 一 量 表达 式 值 有 变化 时 ， 马 上 停止 
程序 运行 。 

rwatch <expr>: 当 表 达 式 〈 变 量 ) expr 被 读 时 ， 停 止 程序 运行 。 

awatch <expr>: 当 表 达 式 〈 变 量 ) 的 值 被 读 或 被 号 时 ， 停 止 程序 运行 。 

info watchpoints: 列 出 当前 所 设置 了 的 所 有 观察 点 。 
下 面 演示 了 观察 i 并 在 连续 运行 next 时 一 旦 发 现 i 变化 ，i 值 就 会 显示 出 来 的 过 程 : 


(gdb) watch i 
Hardware watchpoint 3: i 
(gdb) next 
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23 For fab c Que 3u o 3b aber) 
(gdb) next 
Hardware watchpoint 3: i 


Old value 0 
New value 1 
0x0804838d in main () at gdb example.c:23 


25 Cor (uL e Up abo d 3B) 

(gdb) next 

Breakpoint 1, main () at gdb example.c:25 

25 sum[i] » add(arrayl[i], array2[i]); 
(gdb) next 

23 LOr Wb oc e ab VOTRE 

(gdb) next 


Hardware watchpoint 3: i 


Old value 
New value 
0x0804838d in main () at gdb example.c:23 
23 Corr (tab -— 9B abs dus Gb) 


8. examine 命令 

我 们 可 以 使 用 examine 命令 (缩写 为 x) 来 查看 内 存 地 址 中 的 值 。examine 命令 的 语法 如 下 所 示 ; 

x/«n/f/u» «addr» 

<addr> 表 示 一 个 内 存 地 址 。“x/” 后 的 n、f、u 都 是 可 选 的 参数 ，n 是 一 个 正 整 数 ， 表 示 显 示 内 
存 的 长 度 ， 也 就 是 说 从 当前 地 址 向 后 显示 几 个 地 址 的 内 容 ; f 表示 显示 的 格式 ， 如 果 地 址 所 指 的 是 
字符 串 ， 那 么 格式 可 以 是 s， 如 果 地 址 是 指令 地 址 ， 那 么 格式 可 以 是 i; u 表示 从 当前 地 址 往 后 请 求 
的 字 节 数 ， 如 果 不 指定 的 话 ，GDB 默认 是 4 字 节 。u 参数 可 以 被 一 些 字符 代替 : b 表示 单字 节 ，h 
表示 双 字 节 ，w 表示 四 字 节 ，g 表示 八字 节 。 当 我 们 指定 了 池 节 长 度 后 ，GDB 会 从 指定 的 内 存 地 址 
开始 , 读 写 指定 字 节 ， 并 把 其 当 作 一 个 值 取 出 来 。 n、 f, u 这 3 个 参数 可 以 一 起 使 用 , 例如 命令 “x/3uh 
0x54320” 表 示 从 内 存 地 址 0x54320 开始 以 双 字 节 为 1 个 单位 (h)、16 进 制 方式 (u) 显示 3 个 单位 
(3) 的 内 存 。 

9. jump 命令 

一 般 来 说 ， 被 调试 程序 会 按照 程序 代码 的 运行 顺序 依次 执行 ， 但 是 GDB 也 提供 了 乱 序 执行 
的 功能 ， 也 就 是 说 ，GDB 可 以 修改 程序 的 执行 顺序 ， 从 而 让 程序 随意 跳跃 。 这 个 功能 可 以 由 
GDB 的 jump 命令 “jump <linespec>” 来 指定 下 一 条 语句 的 运行 点 。<linespec> 可 以 是 文件 的 行 
号 ,可 以 是 “file:line” 格 式 ， 也 可 以 是 “+num” 这 种 偏 移 量 格式 ， 表 示 下 一 条 运行 语句 从 哪里 
开始 。 

jump <address> 

这 里 的 <address> 是 代码 行 的 内 存 地 址 。 

主意 ，jump 命令 不 会 改变 当前 的 程序 栈 中 的 内 容 ， 所 以 ， 如 果 使 用 jump 从 一 个 函数 跳 转 到 

一 个 函数 ， 当 跳 转 到 的 函数 运行 完 返 回 ， 进 行 出 栈 操作 时 必然 会 发 生 错 误 ， 这 可 能 导致 意 想 不 

到 的 结果 ， 所 以 最 好 只 用 jump 在 同一 个 函数 中 进行 跳 转 。 
10. signal 命令 
使 用 singl 命令 ， 可 以 产生 一 个 信号 量 给 被 调试 的 程序 ， 如 中 断 信 号 “Ctrl+C”。 这 非常 方便 
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于 程序 的 调试 ， 可 以 在 程序 运行 的 任意 位 置 设置 断 点 ， 并 在 该 断 点 用 GDB 产生 一 个 信号 量 ， 这 

种 精确 地 在 某 处 产生 信和 号 的 方法 非常 有 利于 程序 的 调试 。 

signal 命令 的 语法 是 “signal <signal>”, UNIX 的 系统 信号 量 通常 为 1 一 1$， 所 以 <signal> 取 值 

也 在 这 个 范围 。 
11. return 命令 

如 果 在 函数 中 设置 了 调试 断 点 ， 在 断 点 后 还 有 语句 没有 执行 完 ， 这 时 候 我 们 可 以 使 用 return 

命令 强制 函数 忽略 还 没有 执行 的 语句 并 返回 。 


iet cipe al 
return «expression» 


上 述 return 命令 用 于 取消 当前 函数 的 执行 ， 并 立即 返 
达 式 的 值 会 被 作为 函数 的 返回 值 
12. call 命令 
call 命令 用 于 强制 调用 某 函 数 : 
call «expr» 
表达 式 可 以 是 函数 ， 以 此 达到 
值 不 是 void). 
其 实 ， 前 面 介 绍 的 print 命令 也 可 以 完成 强制 调用 函数 的 功能 
13. info 命令 
info 命令 可 以 在 调试 时 用 来 查看 寄存 器 、 断 点 、 观 察 点 和 信和 号 等 信息 。 要 查看 寄存 器 的 值 ， 
可 以 使 用 如 下 命令 : 
info registers (查看 除了 浮 点 寄存 器 以 外 的 寄存 器 ) 


info all-registers (查看 所 有 寄存 器 ， 包 括 浮 点 寄存 器 》 
info registers «regname ...> (查看 所 指定 的 寄存 器 ) 


要 查看 断 点 信息 ， 可 以 使 用 如 下 命令 

info break 

列 出 当前 所 设置 的 所 有 观察 点 ， 使 用 如 下 命令 
info watchpoints 

查看 有 哪些 信号 正在 被 gdb 检测 ， 使 用 如 下 命令 
info signals 

info handle 


也 可 以 使 用 info line 命令 来 查看 源 代码 在 内 存 中 的 地 址 。info line 后 面 可 以 跟 行 号 、 函 数 名 、 
文件 名 : 行 号 、 文 件 名 :函数 名 等 多 种 形式 ， 例 如 下 面 的 命令 会 打印 出 所 指定 的 源码 在 运行 时 的 内 
存 地 址 : 

info line tst.c:func 

14. disassemble 

disassemble 命令 用 于 反 汇 编 ， 它 可 被 用 来 查看 当前 执行 时 的 源 代码 的 机 器 码 ， 实 际 上 只 是 把 
目前 内 存 中 的 指令 dump 出 来 。 下 面 的 示例 用 于 查看 函数 func 的 汇编 代码 : 


(gdb) disassemble func 
Dump of assembler code for function func: 
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， 如 果 指 定 了 <expression>， 那 么 该 表 
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值 《 如 果 函 数 返回 


n 























强制 调用 函数 的 目的 ， 它 会 显示 函数 的 返 












































































































































































































































































































































0x8048450 «func»: push $ebp 
0x8048451 «func-*1»: mov Sesp, Sebp 
0x8048453 <func+3>: sub $0x18, Sesp 
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0x8048456 <func+6>: movl  $0x0,0xfffffffc(S$ebp) 


End of assembler dump. 


22.2.2 DDD 图 形 界面 调试 工具 

GDB 本 身 是 一 种 命令 行 调试 工具 ， 但 是 通过 DDD (Data Display Debugger，http:/www.gnu. 
org/software/ddd/),， 可 以 被 图 形 界面 化 。 DDD 可 以 作为 GDB、DBX、WDB、Ladebug、JDB、XDB、 
Perl Debugger 或 Python Debugger 的 可 视 化 图 形 前 端 , 其 特有 的 图 形 数据 显示 功能 (Graphical Data 
Display) 可 以 把 数据 结构 按照 图 形 的 方式 显示 出 来 。 

DDD 最 初 源 于 1990 年 Andreas Zeller 编写 的 VSL 结构 化 语言 ， 后 来 经 过 一 些 程序 员 的 努力 ， 演 
化 成 今天 的 模样 。DDD 的 功能 非常 强大 ， 可 以 调试 用 CWC4-. Ada. Fortran. Pascal. Modula-2 
和 Modula-3 编写 的 程序 ， 可 以 超 文 本 方式 浏览 源 代码 ; 能 够 进行 断 点 设置 、 回 溯 调 试 和 历史 记录 
编辑 ， 具 有 程序 在 终端 运行 的 仿真 窗口 ， 具 备 在 远程 主机 上 进行 调试 的 能 力 ; 能 够 显示 各 种 数据 
结构 之 间 的 关系 ， 并 将 数据 结构 以 图 形 化 形式 显示 ; 具有 GDB/DBX/XDB 的 命令 行 界面 ,包括 完 
全 的 文本 编辑 、 历 史 纪 录 、 搜 寻 引 擎 等 。 

DDD 的 主 界面 如 图 22.7 所 示 ， 和 Visual Studio 55:4 
Visual Studio 所 不 包含 的 部 分 功能 。 
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Ff 发 环境 非常 相近 ,而 且 DDD 包含 了 




































Ee DDD: /public/source/programming/ddd - 3.2 /ddd/cxxtest.C SEIS 
File Edit View Program Commands Status Source Data Hi 

* < = < = "Am SEIS = 
Q:] “info al1-registers SY gü Q c *? . hM. a e 4 E 


Lookup Find» Break Watch print Display Piot 








ipt mainCint /* ES BEES j X 
int i = 42; " 
B tree testO: Registers 

Lia A eax: 0x401a2db8 1075457464 
| ecx: 0x8049c94 — 134519356 
; at edx: 0x401a1234 1075450420 
array_test(. ebx: 0x401a41b4 1075462580 





Interrupt 





Step | Stepi 





Next | Nexti 





TY 





ie i 
string test! esp: Oxbfffef30 -1073746128 Until | Finish 
ie ebp: Oüxbfffef48 -1073746104 Cont| Kil 
plot test(); esi: Oxbfffef94 -1073746028 























ETE tQ; edi: 0x1 1 Down 
spese ced eip: 0x8049cal 134519969 
cin cout te: | flags: 0x286 IOPL: 0 
return 0; flags: PF SF IF 
3 orig eax: Oxffffffff -1 
Cs: 0x23 35 1 
m 
T ži 
0x8049c9a «^ æ Integer registers wv Àll registers 


MAD 0x8049cal <r 
0x8049ca6 <r 
0x8049ca9 <r 


rj 
Ay 
0x8049cac <r 
0x8049caf <r Close Help | 
0x8049cb0 «r 
0x8049cb5 <r, 


























0x8049cb8 «maint36»: incl  OxPFTffffcRebp) —— 
0x8049cbb “main+39>: call 0x8049428 «array test(void)» 
0x8049cc0 «mains44»: incl  Oxfffffffc(Xebp) 
0x8049cc3 “main+47>: call 08049404 «string test(void)» 4 
Cgdb) T ] 
= 
rj 
r F 





22.7 DDD 的 主 界面 


在 设计 DDD 的 时 候 ， 设 计 人 员 决 定 把 它 与 GDB 之 间 的 耦合 度 尽 可 能 降低 。 因 为 像 GDB 这 
样 的 开源 软件 ,更 新 比 商 业 软 件 快 。 所 以 为 了 使 GDB 的 变化 不 会 影响 到 DDD, 在 DDD 中 , GDB 
是 作为 独立 的 进程 运行 的 ， 通 过 命令 行 接口 与 DDD 进行 交互 。 
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图 22.8 显示 了 用 户 、DDD、GDB 和 被 调试 进程 之 间 的 关系 ，DDD 和 GDB 之 间 的 所 有 通信 
了 是 异步 进行 的 。 在 DDD 中 发 出 的 GDB 命令 都 会 与 一 个 回调 例 程 相连 ， 放 入 命令 队列 中 。 这 个 
调 例 程 在 合适 的 时 间 会 处 理 GDB 的 输出 。 例 如 ， 如 果 用 户 手动 输入 一 条 GDB 的 命令 ，DDD 
会 把 这 条 命令 与 显示 GDB 输出 的 一 个 回调 例 程 连 起 来 。 一 旦 GDB 命令 完成 ， 就 会 触发 回调 例 
T GDB 的 输出 就 会 显示 在 DDD 的 命令 窗口 中 。 
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22.8 DDD 运行 机 理 
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竺 事件 循环 时 等 竺 用户 输入 和 GDB mls 同时 等 着 GDB 进入 等 待 输入 状态 。 当 GDB 
|j 一 条 命令 就 会 从 命令 队列 中 取出 ， 送 给 GDB. GDB 到 达 的 输出 由 上 次 命令 的 回调 过 
程 来 处 理 。 这 种 异步 机 制 避免 了 DDD 在 等 待 GDB 输出 时 发 生 阻塞 现象 ， 到 达 的 事件 可 以 在 任何 
时 间 得 到 处 理 。 

不 可 否认 的 是 ，DDD 和 GDB 的 分 离 使 得 DDD 运行 速度 相对 来 说 比较 慢 ， 但 是 这 种 方法 带 
来 了 灵活 性 和 兼容 性 的 好 处 。 例 如 ， 用 户 可 以 把 GDB 调试 器 换 成 其 他 调试 器 ， 如 DBX 等 。 另 外 ， 
GDB 和 DDD 的 分 离 使 得 用 户 可 以 在 不 同 的 机 器 上 分 别 运行 GDB 和 DDD. 

Æ DDD 中 , 可 以 直接 在 底部 的 控制 台中 输入 GDB 命令 ， 也 可 以 通过 菜单 和 鼠标 来 以 氏 
式 触发 GDB 命令 的 运行 , 使 用 方法 其 为 简单 , 因此 这 里 不 再 更 述 。 除了 基本 的 GDB 命令 外 , DDD 
中 的 Plot 工具 可 以 用 于 将 数组 以 二 维 或 三 维 坐标 系 中 点 、 曲 线 或 曲面 的 方式 显示 出 来 ， 如 图 22.9 
所 示 ， 这 在 某 些 场合 下 会 非常 有 用 。dsp 工程 师 应 该 不 会 陌生 ， 因 为 在 dsp 程序 调试 中 ， 在 集成 
开发 环境 中 绘制 数组 曲线 是 十 分 常见 的 用 法 。 
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[1 2:8 DDD: /public/source/programming/ddd 3.2 .1 /ddd/cxxtest.C SO EIOX 
File Edit View Program Commands Status Source Data Help 
TERM — A i EEX 
o: id £ —- 
* File Edit View Plot Scale Contour Herp | 
TUU- . . B D D D * * E 











void plot test() 50- 
{ UA. 40- 
static int ir[100]; 
;— DDD: dr g 320- 
f 20- 
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Impulses 

















22.9 DDD 中 的 Plot 绘制 数组 








DDD 不 仅 可 用 于 调试 PC 上 的 应 用 程序 ， 








也 可 调试 





目标 板子 ， 方 法 是 用 妇 











ddd -debugger arm-linux-gdb < 要 调试 的 程序 > 











在 嵌入 式 系统 中 ， 由 于 目标 机 资源 有 限 ， 
户 所 有 的 开发 工作 在 主机 开发 环境 下 完成 ， 






































22 3 Linux 内 核 调 试 


0 下 命令 启动 DDD: 











因此 往往 在 主机 上 编译 好 程序 ， 























包括 编码 、 









































的 程序 。 
调试 嵌入 式 Linux 内 核 的 方法 如 下 。 








(1) 目标 机 “ 插 桩 ”如 打上 KGDB 补丁 ， 这 样 3 





口 或 网 口 通信 。 























TF 


E 机 上 的 GDB 可 与 目 
































(20 使 用 仿真 器 ,仿真 器 可 直接 连接 目标 机 的 JTAG/BDM， 这 样 主机 



































仿真 器 的 通信 来 控制 目标 机 。 


























G) 在 目标 板 上 通过 printk(). oops. strace 等 软件 方法 进行 “观察 ”i 








查看 和 修改 数据 结构 、 断 点 、 单 步 等 功能 。 























第 22.3 一 22.7 节 将 对 这 些 调 试 方法 进行 


不 管 是 目标 机 “ 插 桩 ”还 是 使 用 仿真 器 连接 目 上 一般 都 
采用 GDB。 尽 管 采用 “ 插 桩 ”和 仿真 器 的 方式 可 以 进行 查看 和 修改 数据 结构 、 断 点 、 单 步 等 ， 而 
























































printkO 这 种 最 原始 的 方法 却 更 广泛 地 被 应 用 








讲解 。 











o 


标 机 JTAG/BDM， 在 主机 上 ， 调试 工 











编译 、 连 接 、 下 载 和 调试 等 。 目 标 机 和 主 
机 通过 串口 、 以 太 网 、 仿 真 器 或 其 他 通信 手段 通信 ， 主 机 用 这 些 接口 控制 目标 机 ， 调 试 目 标 机 上 

















再 在 目标 机 上 运行 。 





























pun 


标 机 的 KGDB 通过 是 











型 





的 GDB 就 可 以 通过 与 























周 试 ， 这 些 方法 不 具备 















































是 一 个 环形 缓冲 区 
的 klogd 进程 (一 个 系统 守护 进程 , 它 截 获 并 且 记 录 


22.4 内 核 打 印信 息 一 一 printk() 


在 Linux 中 ， 内 核 打 印 语句 printk( f PEZ fei 4 
因此 ， 如 果 塞 入 的 消息 过 多 ， 就 会 将 之 











(ring buffer), 
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输出 到 内 核 信 息 缓冲 区 : 











。 内 核 信 息 组 冲 
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Linux 
































文件 读 取 绥 冲 区 ， 























内 核 Hi Afi M ZH 区 














且 读 取 完 成 ， 








内 容 ， 每 一 个 被 记录 











内 核 信息 派发 给 syslogd 守护 进程 (syslogd 记录 下 系统 里 所 Tb 



































的 消息 至 少 包 含 时 间 惟 和 主机 名 )，syslogd 这 


























前 的 消息 冲刷 掉 。 








Linux 内 核 日 
被 删除 。 之 后 ，klogd 守护 进程 会 将 读 取 的 

















志 信 息 ) 会 通过 /proc/kmsg 















































志 记 录 








的 程序 给 出 的 日 志和 信息 


























将 不 同 的 服务 产生 的 日 志 记 录 到 不 同 的 文件 : 
/tmp/kernel debug.txt" 一 行 , 则 内 核 信息 
hello.ko”， 我 们 看 至 














Jul 6 00:40:51 localhost kernel: 


用 户 也 可 以 直接 使 用 “ 
























































也 会 被 放置 3 
l|/tmp/kernel debug.txt 文件 中 多 出 如 下 一 行 : 


cat /proc/kmsg 

















Hello World enter 


”命令 来 显示 内 核 信息 ， 但 是 ， 由 于 /proc/kmsg 是 一 























































































































通过 /proc/sys/kernel/printk 文件 可 以 调 














































































































个 守护 进程 会 根据 /etc 
。 例 如 在 /etc/syslog.conf 中 增加 “ kern.* 
到 /tmp/kernel_debug.txt 文件 : 



























































e 控制 台 日 志 级 别 : 优先 级 高 于 该 


的 消息 将 被 打印 至 控 和 




















默认 的 消息 日 志 级 别 : 



































printk 的 输出 等 级 ， 该 文 

















将 用 该 优先 级 来 打印 没有 优先 级 的 消息 




















/syslog.conf 























o TA fT “insmod 





个 



































“ 永 无 休止 的 文件 ” 因此 ,“cat /proc/kmsg” 的 进程 只 能 通过 “Ctrl+tC” 或 kill 终止 。 另 外 ， 使 用 
dmesg 命令 也 可 以 直接 读 取 ring buffer 中 的 信息 。 

printkO 定 义 了 8 个 消息 级 别 ， 分 为 级 别 0 一 7， 越 低级 别 〈 数 值 越 大 ) 的 消息 越 不 重要 ， 第 0 
级 是 紧急 事件 级 ， 第 7 级 是 调试 级 ， 代 码 清单 22.3 所 示 为 printkO 的 级 别 定义 。 

代码 清单 22.3 ”printk() 的 级 别 定义 

1 4define KERN_EMERG "«0»" /* 紧 急事 件 ， 一 般 是 系统 骨 溃 之 前 提示 的 消息 */ 

2 4define KERN ALERT "«1»" /* 必须 立即 采取 行动 */ 

3 4define KERN CRIT "<2>"/* 临 界 状态 ， 通 常 涉及 严重 的 硬件 或 软件 操作 失败 */ 

4 #define KERN ERR "<3>" HAS 告 错 误 状 态 ， 设 备 驱 动 程序 会 

5 经 常 使 用 KERN_ERR 来 报告 来 自 硬件 的 问题 */ 

6 #define KERN WARNING "«4»"  /* 对 可 能 出 现 问 题 的 情况 进行 警告 ， 

7 这 类 情况 通常 不 会 对 系统 造成 严重 问题 */ 

8 #define KERN NOTICE  "«5»"  /* 有 必要 进行 提示 的 正常 情形 ， 

9 许多 与 安全 相关 的 状况 用 这 个 级 别 进行 汇报 */ 

10 #define KERN INFO "<6>" 内 核 提 示 性 信息 ， 很 多 驱动 程序 

11 在 启动 的 时 候 ， 以 这 个 级 别 打印 出 它们 找到 的 硬件 信息 */ 

12 #define KERN_DEBUG "<7>" /* 用 于 调试 信息 */ 




















FH 4 个 数字 值 ， 如 下 所 示 。 


Ro 














志 级 别 








9 
e 最低 的 控制 台 日 志 级 别 : 控制 
e 默认 的 控制 台 日 志 级 别 : 控制 

















可 和 被 设置 的 最 小 信 


























志 级 别 的 默认 值 。 





















































通过 如 下 命令 























M77 3X]. printkO 语 句 输出 ， 但 是 


上 述 4 个 值 的 默认 设置 为 6、4、1、7。 
可 以 使 得 Linux W 4% h94] 
echo 8 > /proc/sys/kernel/printk 
在 设备 驱动 中 ， 我 们 经 常 需要 输出 调 





试 或 系统 信息 ， 














E 何 printk 都 被 输出 : 


(最 高 优先 级 )。 






































通常 可 以 使 用 封装 J 











尽管 可 以 直接 采 
printkO 的 更 高 级 的 宏 ， 如 








j printk("<7>debug 
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pr_debug0、dev_debug0 等 。 代 码 清单 22.4 所 示 为 pr_debug() 和 pr_info() 的 定义 , 代码 清单 22.5 
所 示 为 dev_dbg()、dev_err()、dev_info() 等 的 定义 ， 前 一 组 的 输出 中 不 包含 设备 信息 ， 后 一 组 




















































































































包含 。 
代码 清单 22.4 ”替代 printk() 的 宏 
ifdef DEBUG 
2 define pr debug(fmt,arg...) \ 
3 printk(KERN.DEBUG fmt, ##arg) 
4 else 
5 ereti nl ine (ma Goete dio A oana eese noe an co) 
6 
7 return 0; 
8 
9 endif 
0 
l $dgefine or into(fmb,ar$j...) X 
2 printk(KERN INFO fmt,##arg) 
代码 清单 22.5 包含 设备 信息 的 替代 printk()8 ZR 
define dev printk(level, dev, format, arg...) 
2 printk(level "$s $s: " format , dev driver string(dev) , (dev)Sbus.id , 44 arg) 
3 
4 ifdef DEBUG 
5 paetae dev dbg(dev, format, arg...) N 
6 dev printk(KERN DEBUG , dev , format , ## arg) 
d else 
8 define dev dbg(dev, format, arg...) do { (void) (dev); ) while (0) 
2 endif 
0 
1 4define dev err(dev, format, arg...) D 
2 dev_printk(KERN_ERR , dev , format , ## arg) 
3 4define dev info(dev, format, arg...) N 
4 dev printk(KERN.INFO , dev , format , ## arg) 
5 4$define dev warn(dev, format, arg...) N 
6 dev printk(KERN. WARNING , dev , format , ## arg) 
7 4$define dev notice(dev, format, arg...) \ 
8 dev printk(KERN. NOTICE , dev , format , ## arg) 
在 打印 信息 时 ， 如 果 想 输出 其 所 在 的 函数 ， 可 以 使 用 FUNCTION _， 如 : 
Pprimntk("S5ss Ineorrect TBO 9g from Nn . FUNGTION.., itg, devsame); 
C99 标准 已 经 提供 了 __founc _ 来 指定 函数 名 ， 因 此 目前 _FUNCTION — 实际 定义 为 : 




















define -FUNCTION (fune .) 





LLD 使 用 /proc 









































在 Linux 系统 中 , /proc 文件 系统 十 分 有 用 ， 它 被 用 于 内 核 向 用 户 导 出 信息 。/proc 文件 系统 是 
一 个 虚拟 文件 系统 ， 通 过 它 可 以 使 用 一 种 新 的 方法 在 Linux 内 核 空间 和 用 户 空间 之 间 进 行 通信 。 














在 /proc 文件 系统 中 , 我们 可 以 将 对 虚拟 文件 的 读 写 作为 与 内 核 中 实体 进行 通信 的 一 种 手段 ,与 普 





ibt 





不同 的 是 ， 这 些 虚 拟 文件 的 内 容 都 是 动态 创建 的 。/proc PRSSCTEJEdESE Re REB. En 



































































































































INUX 


Linux 设备 驱动 的 调试 

















ODO 








点 可 写 ， 还 可 用 于 一 定 的 控制 或 配置 目的 ， 例 如 前 面 介绍 的 写 /proc/sys/kernel/printk 可 以 改变 printk 
的 打印 级 别 。 

Linux 系统 的 许多 命令 本 身 都 是 通过 分 析 /proc 下 的 文件 来 完成 ， 如 ps. top. uptime 和 free 
等 。 例 如 ，free 命令 通过 分 析 /proc/meminfo 文件 得 到 可 用 内 存 信 息 ， 下 面 显示 了 对 应 的 meminfo 
文件 和 free 命令 的 结果 。 
@ meminfo 文件 : 








































































































[rootülocalhost proc]# cat meminfo 
MemTotal: 29516 kB 
MemFree: 1472 kB 
Buffers: 4096 kB 
Cached: 12648 kB 
SwapCached: 0 kB 
Active: 14208 kB 
nactive: 8844 kB 
HighTotal: 0 kB 
HighFree: 0 kB 
LowTotal: 29516 kB 
LowFree: 1472 kB 
SwapTotal: 265064 kB 
SwapFree: 265064 kB 
DEEV: 20 kB 
Writeback: 0 kB 
Mapped: 10052 kB 
Sra 3864 kB 
CommitLimit: 279820 kB 
Committed AS: 13760 kB 
PageTables: 444 kB 
VmallocTotal: 999416 kB 
VmallocUsed: 560 kB 


VmallocChunk: 998580 kB 
@ free 命令 : 


[root@localhost proc]# free 


towan used free shared buffers cached 
Mem: 29516 28104 1412 0 4100 12700 
/nS he rS TERIA 
Swap: 265064 0 265064 


















































Linux HW] USB. PCI 等 内 核 代码 本 身 都 会 创建 /proc 节点 导出 内 核 信息 ， 虽 然 不 值得 鼓励 ， 但 
在 Linux 设备 驱动 程序 中 ， 了 驱动 工程 师 自 定义 /proc 节点 以 向 外 界 传递 信息 的 方法 仍然 是 可 行 的 。 
在 Linux 系统 中 ， 可 用 如 下 函数 创建 proc 节点 : 


struct proc dir entry *create proc entry(const char *name, mode t mode, 































































































struct proc dir entry *parent); 


struct proc dir entry *create proc read entry(const char *name, mode t mode, 
struct proc dir entry oa read proc t *read proc, void * data); 


create proc entry PK Zi H T- i] &£&/proc 节点 ,而 create proc read entry()Ui] Hj create proc entry() 
创建 只 读 的 /proc 节点 。 参 数 name 为 /proc 节点 的 名 称 ，parent/base 为 父 目 录 的 节点 ， 如 果 为 NULL， 
则 指 /proc 目录 ，read_proc 是 /proc 节点 的 读 函 数 指针 。 当 read0 系 统 调用 在 /proc 文件 系统 中 执行 
时 ， 它 映像 到 一 个 数据 产生 函数 ， 而 不 是 一 个 数据 获取 函数 。 
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下 列 函 数 用 于 创建 /proc 目录 : 

struct proc dir entry *proc mkdir(const char *name, struct proc dir entry *parent); 
结合 create proc entry()fll proc mkdir(), 代码 清单 22.6 中 的 程序 可 用 于 先 在 /proc 下 创建 一 个 
目录 ， 而 后 在 该 目录 下 创建 一 个 文件 。 










































































代码 清单 22.6 proc_ mkdir() 和 create_proc_entry() 函 数 使 用 范例 
/* 创建 /proc 下 的 目录 */ 
example dir = proc mkdir("procfs example", NULL); 
if (example dir == NULL) { 
rv = = ENOMEM; 
GOLO OUt? 
} 





example dir-owner = THIS MODULE; 


£e» Qo. J + ME UT adeo hosp 


/* &]g — MIT /proc xf */ 





example file - create proc entry("example file", 0666, example dir); 
if (example file == NULL) { 

rv = - ENOMEM; 

goto out; 


example fileoowner = THIS MODULE; 
example fileoread proc = example file read; 





0 
1 
2 
3 
4 
SUE 
6 
1 
8 
9 example file write proc = example file write; 
作为 上 述 函 数 各 返回 值 的 proc. dir entry 结构 体 中 包含 了 /proc 节点 的 读 函 数 指针 (read_proc t 
*read_proc)、 写 函数 指针 (write_proc_t*write_proc〉 以 及 父 节点 、 子 节点 信息 等 。 


/proc 节点 的 读 写 函数 的 类 型 分 别 为 : 
typedef int (read proc t) (char *page, char **start, off t off, 


















































ES 
typedef int (write proc t) (struct file *file, const char . user *buffer, 
unsigned long count, void *data); 


读 函 数 中 page 指针 指向 用 于 写 入 数据 的 缓冲 区 ，start 用 于 返回 实际 的 数据 写 到 内 存 页 的 位 置 ， 
eof 是 用 于 返回 读 结 束 标 志 ，offset 是 读 的 偏 移 ，count 是 要 读 的 数据 长 度 。 

start 参数 比较 复杂 ， 对 于 /proc 只 包含 简单 数据 的 情况 ,通常 不 需要 在 读 函 数 中 设置 *start， 意 
味 着 内 核 将 认为 数据 保存 在 内 存 页 偏 移 0 的 地 方 。 如 果 将 *start 设置 为 非 0 值 ， 意 味 着 内 核 将 认为 
*start 指向 的 数据 是 offset 偏 移 处 的 数据 。 

写 函 数 与 file operations 中 的 write0) 成 员 类 似 , 需要 一 次 从 用 户 缓冲 区 到 内 存 空间 的 复 什 

Linux 系统 中 可 用 如 下 函数 删除 /proc 节点 : 


void remove proc entry(const char *name, struct proc dir entry *parent); 
Linux 系统 中 已 经 定义 好 的 可 使 用 的 /proc 节点 宏 包 括 : proc root fs C/proc?. proc net 
(C/proc/net)、proc_bus (/proc/bus). proc root driver (/proc/driver) 等 ，proc root fs 实际 就 
是 NULL。 
代码 清单 22.7 所 示 为 一 个 简单 的 /proc 使 用 范例 ， 这 段 代码 在 模块 加 载 函 数 中 创建 /proc 文件 
节点 ， 在 模块 和 抒 载 函数 中 撤销 /proc 节点 ， 而 文件 中 只 保存 了 一 个 32 位 的 无 符号 整形 值 。 
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代码 清单 22.7 /proc 文件 系统 使 用 模板 


eo 


























1 4£4include 

2 
Eee 
4 static unsigned long val - 0x12345678; 

3) 

6 /* 读 /proc 文件 接口 */ 

7" ssize t simple proc read(char *page, char **start, off t off, int count, 
8 int*eof, void *data) 

SR qi 

0 int len; 

1 if (off » 0) ( /* BED UR] */ 

2 *eof = 1; 

3 return 0; 

4 } 

5 

6 len = sprintf(page, "$08xMXn", val); 

3 

8 return len; 

9 

20 

21 /* 5S/proc 文件 接口 */ 

22 ssize t simple proc write(struct file *filp, const char | user *buff, unsigned 
23 long len, void *data) 





25 #define MAX_UL_LEN 8 

26 char k buf [MAX UL LEN]; 

27 char *endp; 

28 unsigned long new; 

29 int count = min(MAX UL LEN, len); 
30 int oket: 





eH 

32 (yn (no 

939 ret = = EFAULT; 

34 goto err; 

35. J else i 

36 new = simple strtoul(k buf, &endp, 16); /* 字符 串 转化 为 整数 */ 
37 if (endp -- k buf) ( /* EARRAS */ 

38 ret = - EINVAL; 

39 goto err; 

40 } 

41 val = new; 

42 return count; 

43 } 

44 err: 

45 return ret; 

46 } 

47 

48 int init simple proc init (void) 

49 ( 

50 proc entry - create proc entry("sim proc", 0666, NULL); 
S if (proc entry == NULL) { 

52 printk(KERN INFO "Couldn't create proc entryNMn"); 
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53 
54 
99) 
56 
57 
58 
89) 
60 
61 
62 
63 
64 
65 
66 
67 
68 
69 
7/0 
Tt 
12 
T 
74 


上 述 代 码 第 36 fT ii] 


GIO ONG INIT 
} else { 


proc_entry>read proc = simple proc read; 


proc_entry>write_proc = simple proc write; 


proc entryoowner - THIS MODULE; 


} 
return 0; 


SLES 


return -ENOMEM; 


void exit simple proc exit (void) 


{ 


remove proc entry("sim proc", &proc root); // 撤 销 /proc 


} 


module init(simple proc init); 


module exit(simple proc exit); 


MODULE AUTHOR("Barry Song, author(ülinuxdriver.cn"); 


MODULE DESCRIPT 
MODULE VERSION(' 


hib z (9 e 





























参数 16 意味 3 

















az 


权 


ta 
2 


读 


ae 





88 





















































ON("A simple Module for showing proc"); 





























的 simple_strtoulO0 用 于 转换 用 户 输入 的 字符 串 为 无 符号 长 整数 ， 第 3 个 
转化 方式 是 十 六 进 制 。 
编译 上 述 简 单 的 “sim_proc.c” 为 “sim_proc.ko” 运行 “insmod sim_proc.ko” 加 载 该 模块 后 , /proc 
目录 下 将 多 出 一 个 文件 sim_proc,“1s -1” 的 结果 如 下 : 











ootelocalhost ot ts Sm 


W-rw-rw- OO 


限 与 











Ẹ root 





ootGlocalhost proc]£t cat sim proc 


345678 





Ü Sen 4 20:91 spmocproe 


创建 /proc/sim_proc 时 给 出 的 0666 参数 是 一 致 的 ， 现 在 读 取 sim_proc， 如 下 所 示 : 





出 来 的 正好 是 我 们 赋 的 初 值 0x12345678 。 


测试 写 /proc/sim_proc 文件 ， 使 


oot@l 























888888 








说 明 我 们 上 一 步 执行 


lE 




















ln 





ocalhost driver study echo 
再 查看 新 但 


root@localhost driver study cat / 














] echo 命令 修改 它 为 0x88888888: 


88888888 » /proc/sim proc 


proc/sim proc 


的 写 操作 是 正确 的 。 


2.2.06 Oops 


内 核 出 现 Segmentation Fault 时 《例如 
到 控制 台 和 写 入 系统 ring 

我 们 编写 一 个 字符 设 
22.8 所 示 。 




















buffer. 
备 驱 动 ， 使 让 它 产 9 








内 核 访问 一 个 并 不 存在 的 虚拟 地 址 )，Oops 会 被 打印 























E Oops,， 在 其 读 写 函数 中 都 访问 0 地 址 ， 如 代码 清单 























AA 
命令 
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代码 清单 22.8 产生 Oops 设备 驱动 的 读 写 函数 
1 static ssize t oopsexam read(struct file *filp, char *buf, size t len, loff t *off) 
ZIET 
3 int *pz0; 
4 *p i; /* 故意 访问 0 地 址 */ 
5 return len; 
6 
3 
8 


static ssize t oopsexam write(struct file *filp, const char *buf, size t len, loff t 

9 TOER) 

OUR 

E ine 0 

IA o S ob A a O 

3 return len; 

14 } 

假设 这 个 字符 设备 对 应 的 设备 节点 是 /dev/oops_example， 通 过 “echo 1 > /dev/oops_example” 

写 设备 文件 ， 将 得 到 如 下 Oops 信息 : 

Unable to handle kernel NULL pointer dereference at virtual address 00000000 

printing eip: 

c381a013 

*pde = 00000000 

Oops: 0002 [41] 

PREEMPT SMP 

Modules linked in: oops.example 

QPU 0 

EDER 0060:[«c381a013»] Not tainted VLI 

EFLAGS: 00010286 (2.6. 15:9) 

EIP is at oopsexam writet*0x4/0x1ll [oops example] 

eax: 00000002 ebx: c2b35480 ecx: 00000000 edx: c381a00f 

esi: 00000002 edi: 080e9408  ebp: c2007fa4 esp: c2007f68 

ds: 0O0Jb- est 0DTb. Ss: 0068 

Process bash (pid: 2453, threadinfo-c2006000 task-c2021570) 

Stack: c015e036 c2535480 080e9408 00000002 c2007£a4 00000000 c25035480 fffffff7 
080e9408 c2006000 c015e1l1d1 c2535480 080e9408 00000002 c2007f£a4 00000000 
00000000 00000000 00000001 00000002 c0102f£9f 00000001 080e9408 00000002 

Call Trace: 

[€«c015e036»5] vfs write-*0xc5/0x18f 
[«c015eld1»5] sys write-*0x51/0x80 
[«c0102f9f»] sysenter past esp*t0x54/0x75 
Code: Bad EIP value. 
上 述 Oops 的 第 一 行 给 出 了 “原因 ” 即 访 问 了 “NULL pointer". Oops 中 的 “EIP is at oopsexam - 


B 









































write-0x4/0x11 [oops_examplel]” 这 一 行 也 比较 关键 ， 给 出 了 “ 事 发 现场 ” 即 oopsexam  write() 
函数 偏 移 4 字 节 的 指令 处 。 


场 » 





























通过 反 汇编 可 以 知道 偏 移 4 字 节 的 指令 对 应 的 C 代码 ， 如 下 所 示 : 


00000000 <oopsexam read>: 











0 8b 44 24 0c mov Oxc($esp,1),$eax 
4 c7 05 00 00 00 00 01 movl $0x1,0x0 

4 BE 00 00 00 

5 e: c3 ret 




















第 3 行 的 “movl — $0x1,0x0" XI "*p- 1;” 这 里 仅仅 给 出 了 一 个 例子 ， 实 际 的 “ 事 发 现 
并 不 这 么 容易 被 找到 ， 但 方法 都 是 类 似 的 。 
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同样 地 ， 我 们 通过 “cat /devwoops_example” 命 令 去 读 设 备 文 件 ， 将 得 到 如 下 Oops 信息 : 

Unable to handle kernel NULL pointer dereference at virtual address 00000000 

printing eip: 

c381a004 

*pde = 00000000 

Oops: 0002 [42] 

PREEMPT SMP 

Modules linked in: oops.example 

GEU 0 

ETES 0060: [<c381a004>] Not tainted VLI 

EFLAGS: 00010286 (250r SS) 

EIP is at oopsexam read+0x4/0xf [oops example] 

eax: 00001000  ebx: c0d80180  ecx: 00000000  edx: c381a000 

esi: 00001000 edi: 0804d8d0 ebp: cldf5fa4 SIS MEG NIIS O 

ds: 00T7Tb' est: ODXZb. Sst 0068 

Process cat (pid: 2969, threadinfo-cldf4000 task-c2021570) 

Stack: c015dd9e c0d80180 0804d8d0 00001000 cidf5fa4 00000000 c0d80180 fffffff7 
0804d8d0 cidf4000 c015ei151 c0d80180 0804d8d0 00001000 cidf5fa4 00000000 
00000000 00000000 00000003 00001000 c0102£9f 00000003 0804d8d0 00001000 

Call Trace: 

[«c015dd9e»] vfs read*0xc5/0x18f 
[<c015e151>] sys read*0x51/0x80 
[«c0102f9f»5] sysenter past esp*t0x54/0x75 

Code; Bad EIP value. 


现在 给 出 的 “原因 ”与 写 时 完全 相同 ， 但 是 “ 
节 的 指令 处 。 

在 驱动 中 如 果 发 现 硬件 或 软件 的 运行 情 ; 
出 一 个 Oops， 以 便于 提供 bug 的 上 下 文 信息 : 

(人 

内 核 中 有 许多 地 方 调用 的 “BUG0;” 语 句 中 的 BUGO 宏 通常 就 被 定义 为 该 语句 ， 它 非常 像 一 
个 内 核 运行 时 的 断言 ， 意 味 着 本 来 不 该 执行 到 BUGO 这 条 语句 ， 一 旦 执行 即 抛 出 Oops. BUGO3XE 
有 一 个 变 体 叫 BUG_ON0O， 只 有 当 括 号 内 的 条 件 成 立 的 时 候 ， 才 抛 出 Oops. 





























| 
| 


和 发 地 ” 变 成 了 oopsexam read() 函 数 偏 移 4 字 


















































当 





见 与 预期 的 不 一 致 ， 完 全 可 以 通过 下 面 的 语句 故意 抛 
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在 Linux RAP, strace 是 一 种 相当 有 效 的 跟踪 工具 , 它 的 主要 特点 是 可 以 被 用 来 监视 系统 调 
Je RATM AH strace 调试 一 个 新 开始 的 程序 ， 也 可 以 调试 一 个 已 经 在 运行 的 程序 〈 这 意味 
着 把 strace 绑 定 到 一 个 已 有 的 PID 上 )。 对 于 第 6 章 的 globalmem 字符 设备 文件 ， 以 strace 方式 运 
了 如 代码 清单 22.9 所 示 的 用 户 空 间 应 用 程序 globalmem_test， 运 行 的 结果 如 下 : 
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execve("./globalmem test", ["./globalmem test"], [/* 24 vars */]) - O0 
open("/dev/globalmem", O RDWR) -3 /* i[JfÜj]/dev/globalmem HM] fd 7É 3 */ 
skexeie dL Sy. FIBMAR: 19)) = 0 

read(3，0xbff17920，200) = -1 ENXIO (No such device or address)/* 读 取 失败 */ 
fstat64(1, (st mode-S IFCHR|0620, st rdev-makedev(136, 0), ...}) = 0 


mmap2 (NULL, 4096, PROT READ|PROT WRITE, MAP PRIVATE|MAP ANONYMOUS, -1, 0) = 0xb7f04000 





588 INUX 





Linux 设备 驱动 的 调试 


ODO 








write(1, "-1 bytes read from globalmemNn", 29-1 bytes read from globalmem 
) = 39 /* 向 标准 输出 设备 (fd 为 1) 写 入 printf 中 的 字符 串 */ 
write(3, "This is a test of globalmem", 27) - 27 


write(1, "27 bytes written into globalmemNn", 3227 bytes written into globalmem 
jme 


输出 的 每 一 行 对 应 一 次 Linux 系统 调用 ， 其 格式 为 “左边 = 右边 ”， 等 号 左边 是 系统 调用 的 函 
数 名 及 其 参数 ， 右 边 是 该 调用 的 返回 值 。 
代码 清单 22.9 用户 空间 应 用 程序 globalmem test 
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JL TOI. ve 
2 
B define MEM_CLEAR 0x1 
4 main() 
5 
6 aie aeiy imeni TOIS 
7 char wr ch[200] -» "This is a test of globalmem"; 
8 ehar ra (elo [L 220010) ]] 
9 /* 打开 /dev/globalmem */ 
0 fd -» open("/dev/globalmem", O RDWR, S IRUSR | S IWUSR); 
1 if (fd !- -1) ( /* a globalmem */ 
2 ES (Ero certe Met CLE MEM CERAR; 077 SN OT) 
3 printf("ioctl command failed Win"); 
4 /* i& globalmem */ 
5 num = read(fd, rd ch, 200); 
6 printf("$d bytes read from globalmem\n", num); 
3l 
8 /* 5j globalmem */ 
9 num = write(fd, wr ch, strlen(wr ch)); 
20 printf("$d bytes written into globalmemWn",num); 
21i mu 
22 close(fd); 
23 } 
24 } 
































使 用 strace 虽然 无 法 直接 追踪 到 设备 驱动 中 的 函数 ， 但 是 足够 可 以 帮助 工程 师 推 沉 ， 如 从 
"* open("/dev/globalmem", O_RDWR) = 3” 的 返回 结果 知道 /dev/globalmem If] fd 73 3, Je] fd X 
3 的 文件 进行 的 read(). write fl ioctl0 系 统 调用 最 终 都 会 引起 globalmem 中 file operations 中 的 相 
应 函数 被 调用 ， 通 过 系统 调用 的 结果 就 可 以 知道 驱动 中 globalmem read(). globalmem write) 4l 
globalmem ioctlO 的 运行 结果 。 

LDD6410 开发 板 的 文件 系统 中 已 经 包含 了 strace 工具 ， 可 以 直接 使 用 ， 对 应 strace 的 源 代码 
位 于 LDD6410 工程 的 utils/strace-4.5.16 目录 。 


CCC. 


22.8.1 kcore 
GDB 调试 器 可 以 把 内 核 作 为 一 个 应 用 程序 来 调试 ， 在 这 种 方式 中 ， 需 要 给 GDB 指定 未 压缩 
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的 内 核 映 像 的 文件 名 和 “core 文件 ”的 名 字 。 对 于 一 个 正在 运行 的 内 核 ,“core 文件 ”就 是 运行 时 
的 内 存 映像 /proc/kcore Ckcore 代表 整个 内 核 地 址 空间 ， 对 应 于 所 有 的 物理 内 存 )。 因 此 ， 使 用 GDB 
和 kcore 调试 内 核 的 典型 命令 如 下 : 


gdb /usr/src/linux/vmlinux /proc/kcore 


第 一 个 参数 是 非 压缩 的 ELF 核心 可 执行 文件 的 名 字 ， 不 能 是 zImage. bzlmage. 58 — 7 27 
是 内 核 档案 的 名 称 ， 如 同 其 他 /proc 中 的 文件 ，/proc/kcore 是 在 被 读 的 时 候 才 产生 的 。 

在 “gdb <path>/vmlinux /proc/kcore” 这 种 调试 方式 中 ， 可 用 print 命令 打印 变量 ， 如 “print 
jiffies”。 当 从 GDB 打印 数据 时 间 ，GDB 会 缓存 已 经 读 取 的 数据 ， 但 是 由 于 内 核 正在 执行 ， 各 种 
数据 项 在 不 同时 间 有 不 同 的 值 ，GDB 的 缓存 可 能 导致 连续 多 次 读 取 同一 变量 得 到 相同 的 值 。 例 如 ， 



















































































































































































多 次 显示 jiffies: 
gdo) print jiffies 


( 

$3 = 153729 

(gdo)» print jiffies 
$4 = 153729 

(gdo) print Jrffres 
$5 = 153729 


虽然 jiffies 己 经 变更 了 , 但 每 次 print 出 来 的 都 是 第 1 次 的 值 133729。 为 避免 此 问题 ， 我 们 可 
以 在 需要 刷新 GDB 缓存 时 发 出 “core-file /proc/kcore” 命 令 ， 这 将 导致 调试 器 使 用 新 的 “core X 
件 ” 并 且 丢 弃 旧 信息 。 当 执行 “core-file /proc/kcore ”命令 后 ， 再 运行 “print jiffies”， 值 会 发 生变 
化 ， 如 下 所 示 ; 


(gdb) core-file /proc/kcore 




















SE 





























Core was generated by 'ro root-/dev/sdal hdc-ide-scsi'. 
#0 0x00000000 in globalmem fops () 

(gdb) print jiffies 

$6 = 178683 


$6 L5$3. $4. $5 要 大 ， 这 说 明 新 的 值 被 print 出 来 了 。 
为 了 使 Linux 系统 中 包含 /proc/kcore 文件 ,必须 在 编译 时 包含 “/proc/kcore support "Cit E] 22.10 
所 示 ), 而 为 了 给 GDB 提供 symbol 信息 ,必须 设 定 CONFIG. DEBUG INFO 选项 来 编译 内 核 (如 
图 22.11 所 示 )。 
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dddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddd 
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x lqqqqqqqqaqaqqaqaadadaqaaaqaqaqadadaddadqaqqaaaaaaadddaaqqqqaaqaaadddaqqqquqak 
[*] /proc file system support 





[8] ¿proc/kcore supporti 

[*] Virtual memory file system support {former shm fs) 
[ ] HugeTLB file system support 

< > Relayfs file system support 


和 
XR 


x x 
x x 
x x 
x x 
x x 
x x 
x x 
x x 
x x 
x x 
x x 
x x 
x x 
x x 
x x 


nqdqaqaqqdqaqaqaqqqqaqaqaqqaqaddqqqaqaqqaaaaaadadaaqaqaaaqaaqdaddeadqqqaaaaaaddadaqqaqad) 
todddddddddddddddodddddddddddddddddddddddddddddddddddddddddddddddddddddddddu 
x KSelect»| < Exit > < Help > x 
nqqqqaqdaqaqqaqaqaqaaqaaqaaddaaaaqqaaaaqaaadadaaqaqaaaaaaddeaddqquqqaaaadaddadqadqqqqadi 














22.10 ”编译 内 核 包 含 /proc/kcore 支持 
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AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA 
lqqqqqqqqdqqqadqqqqqdqqqdddqg Kernel hacking qqqqqqqqqdqqqaaddaqqddaqqaddak 
X Arrow keys navigate the menu. «Enter» selects submenus --->. x 
x Highlighted letters are hotkeys. Pressing «Y» includes, «N» excludes, x 
x «lI modularizes features. Press «Esc»«Esc» to exit, «?» for Help, </> x 
x for Search. Legend: [*] built-in [ ] excluded «Ib module < > x 
x lqqqqdd^(-)dqqaqqqaqaaqqaaqaqaqaqaaaaqqaaaaddddddddadadqqqaqaqaqaqaqaqaqaqqqqaqaqaqaqaqdqddqdqk x 
XX E] Collect scheduler statistics XX 
XX [ ] Debug memory allocations XX 
XX [1 Spinlock debugging xx 
XX Eg Sleep-inside-spinlock checking Xx 
XX [ ] kobject debugging XX 
XX [ ] Highmem debugging XX 
Xx [8] Compile the kernel with debug infoj XX 
Xx [] Debug Filesystem XE 
XX [ ] Debug VM XX 
Xx [*] Compile the kernel with frame pointers xXx 
x nqqqaqqqv«-«) qqqqaqqqdqqdaaqqaaqaaqqaaqqaaqaaqqaqaqqdaaqaqaaqdqaqqdqqdqqaqqqaqdqqdqj x 
Ne 
x KSelect»| < Exit > < Help > x 
mcddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddd 








22.11 编译 内 核 包 含 调试 信息 

















TE “gdb <path>/vmlinux /proc/kcore” 这 种 调试 方式 中 ，GDB 的 绝 大 多 数 功能 都 不 能 使 用 ， 如 

修改 内 核 变量 的 值 、 设 置 断 点 、 单 步 执行 等 ， 而 22.9.2 和 22.9.3 小 节 将 要 介绍 的 KDB 和 KGDB 

方式 则 可 支持 这 些 功能 。 

秆 得 一 提 的 是 ， 可 加 载 模块 的 symbol 并 未 包含 在 vmlinux 中 ， 必 须 使 用 一 些 辅助 方法 才能 调 

EUER. Linux 可 加 载 模块 是 ELF 格式 的 可 执行 映像 ， 它 们 被 分 成 几 个 段 ， 有 3 个 典型 的 与 模块 

调试 相关 的 段 。 

e 人 

€  .bss/data: 这 两 个 段 包 含 模块 的 变量 ， 在 编 

过 的 变量 在 .data Bt H 

当 一 个 模块 被 加 载 后 ，/sysmodule/ 目录 下 会 新 增 一 个 对 应 于 该 模块 的 目录 ， 如 “insmod 

globalmem.ko” 后 ， 将 生成 sysmodule/globalmem,， 在 该 目录 下 又 包含 一 个 sections 目录 ,运行 “ls -a” 
命令 可 以 获得 该 目录 下 包含 的 文件 : 


root8(localhost sections]# ls -a 


































































































译 时 未 初始 化 的 变量 在 .bss 中 ， 而 被 初始 化 
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.bss .gnu.linkonce.this module .rodata.strl.1 .symtab . versions 
.data .rodata ote TESI .text 


通过 cat 其 中 的 .text、.data、.bss 可 以 得 到 我 们 感 兴趣 的 3 个 段 的 地 址 ， 如 下 所 示 : 












































root8ülocalhost sections]f£ cat .text 

0xc3816000 

root8ülocalhost sections]f cat .bss 

0xc3816088 

root8ülocalhost sections]# cat .data 

0xc3816a94 

之 后 就 可 以 借用 GDB 的 add-symbol-file 来 添加 模块 的 符号 信息 , 这样 之 后 便 可 以 查看 模块 中 





























的 变量 了 ， 如 下 所 示 : 
(gdb) add-symbol-file globalmem.ko 0xc3816000\ 
-S .bss 0xc3816588N 
-s .data 0xc3816a94 
add symbol table from file "globalmem.ko" at 
.text addr = 0xc3816000 
.bss_addr = 0xc3816b88 
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.data_addr = 0xc3816a94 
(vern 
Reading symbols from globalmem.ko...done. 
(gdb) p globalmem major (查看 globalmem.ko 中 的 变量 ) 
$7 = 254 


22.8.2 KDB 


KDB Jji H Hi Silicon Graphics 维护 ， 为 使 内 核 内 骨 KDB， 需 要 从 Silicon Graphics 的 FTP 
占 点 下 载 与 内 核 版 本 有 关 的 补丁 ， 一 个 是 公共 补丁 (包含 了 对 通用 内 核 代码 的 更 改 )， 男 一 个 
是 特定 于 体系 结构 的 补丁 , 下 载 地 址 为 ftp://oss.sgi.com/www/projects/kdb/download。 给 内 核 打 
上 KDB 补丁 之 后 , VIZ" Kernel hacking ”编译 选项 中 就 会 包含 与 KDB 相关 的 内 容 , 如 图 22.12 
所 示 ， 选 中 “Built-in Kernel Debugger support”， 并 根据 实际 需求 选择 默认 的 KDB 状态 为 OFF 
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或 ON。 
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XX [ ] KGDB: kernel debugging with remote gdb xXx 
Xx [*] Check for stack overflows XX 
Xx [ ] Stack utilization instrumentation Xx 
xx [ ] Page alloc debugging xXx 
Xx [ ] Use J4Kb for kernel stacks instead of 8Kb XX 
XX [*] Built-in Kernel Debugger support XX 
Xx <> KDE modules (NEW) XX 
XX [ ] KDB off by default (NEW) XX 
Xx (0) KDB continues after catastrophic errors (NEW) Xx 
x mdqdddqddddddddadddddddddddddddddddddddddddddddoqdddddddqddddddddddddddddd] x 
taqqqqqqqyaqqagararg a rrr 
x KSelect» < Exit > < Help > x 
aqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqy 











22.42 KDB 编译 选项 



































如 果 编 译 期 间 没 有 选中 CONFIG_KDB OFF 〈 即 选择 了 “KDB off by default”)， 那 么 在 默认 
况 下 KDB 是 活动 的 。 和 否则 ， 需 要 显 式 地 激活 它 ， 通 过 在 引导 期 间 将 KDB=on 标志 传递 给 内 核 
或 者 通过 执行 如 下 命令 可 激活 KDB: 
echo "1" »/proc/sys/kernel/kdb 
反 过 来 , 如 果 默 认 情 况 下 KDB 是 打开 的 , 那么 将 KDB = off jai P6 5 EL | DAT LR dr 
令 将 会 取消 激活 KDB: 
echo "0" »/proc/sys/kernel/kdb 

在 引导 期 间 还 可 以 将 另 一 个 标志 传递 给 内 核 , BU KDB = early» early 标志 将 导致 在 引导 过 
程 的 初始 阶段 就 把 控制 权 传 递 给 KDB， 这 将 非常 有 利于 工程 师 在 引导 过 程 初 始 阶段 进行 内 核 
调试 。 
在 两 种 情况 下 KDB 会 被 调用 : 当 KDB 处 于 打开 状态 时 ， 只 要 内 核 中 有 紧急 情况 就 会 自动 i 
用 它 ， 其 次 ， 按 下 键盘 上 的 “Pause” 键 也 可 手工 调用 KDB。 使 用 KDB 可 进行 内 存 和 寄存 器 修改 、 
设置 断 点 和 跟踪 堆栈 等 
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KDB 中 进行 内 存 显示 和 修改 的 常用 命令 是 md 和 mm. md 命令 以 一 个 地 址 /符号 和 行 计 数 
line-count 为 参数 ， 显 示 从 该 地 址 开始 的 line-count 行 的 内 存 。 如 果 没 有 指定 line-count， 那 么 
就 使 用 环境 变量 所 指定 的 默认 值 。 如 果 没 有 指定 地 址 ， 那 么 md 就 从 上 一 次 打印 的 地 址 继续 。 
mm 命令 用 于 修改 内 存 内 容 ， 它 以 地 址 /符号 和 新 内 容 作为 参数 ， 用 新 的 内 容 蔡 换 指定 地 址 处 
的 内 容 。 

例如 ， 如 下 命令 可 显示 从 0xc000000 开始 的 15 行内 存 : 

kdb» md 0xc000000 15 

如 下 命令 可 将 内 存 位 置 为 0xc000000 上 的 内 容 更 改 为 0x10: 

kdb» mm 0xc000000 0x10 

rd 命令 用 于 显示 处 理 器 寄存 器 的 内 容 ，rm 命令 用 于 修改 寄存 器 的 内 容 。 它 以 寄存 器 名 称 和 新 
的 内 容 作 为 参数 ， 用 新 的 内 容 修改 寄存 器 。 寄 存 器 名 称 与 特定 的 体系 结构 有 关 。 目 前 ， 不 能 修改 
控制 寄存 器 。 

KDB 中 常用 的 断 点 命令 有 bp. bc. bd. be 和 bl。bp 命令 以 一 个 地 址 /符号 作为 参数 ， 当 过 到 
断 点 时 则 系统 停止 执行 并 将 控制 权 交 予 KDB; bl 命令 列 出 当前 的 断 点 集 ， 它 包含 了 启用 和 禁用 
rex: be 命令 用 于 启用 断 点 ， 该 命令 的 参数 是 断 点 号 ; bc 命令 用 于 从 断 点 表 中 去 除 断 点 ， 它 以 
断 点 号 或 “*” 作 为 参数 ， 为 “*” 意 味 着 去 除 所 有 断 点 。 

例如 ， 执 行 如 下 命令 将 对 函数 sys_write0 设 置 断 点 : 

kdb» bp sys write 

执行 如 下 命令 可 列 出 断 点 表 中 的 所 有 断 点 : 

kdb» bl 

执行 如 下 命令 可 清除 断 点 号 为 1 的 断 点 : 
kdb» bc 1 
KDB 中 主要 的 堆栈 跟踪 命令 有 bt, btp, bte 和 btas bt 命令 提供 有 关 当 前 线程 的 堆栈 的 信息 ; btp 
命令 以 进程 标识 作为 参数 ， 并 对 这 个 特定 进程 进行 堆栈 回溯 ;btc 命令 对 每 个 活动 CPU EIE 
在 运行 的 进程 执行 堆栈 回溯 ， 它 从 第 一 个 活动 CPU 开始 执行 bt， 然 后 切换 到 下 一 个 活动 
CPU， 依 次 类 推 :bta 命令 对 处 于 某 种 特定 状态 的 所 有 进程 执行 回溯 ， 可 以 有 选择 性 地 将 各 
种 参数 传递 给 该 命令 ， 回 渊 选 项 包括 D (不 可 中 断 状态 )、R〔 正 运行 )、S〔 可 中 断 休眠 )、 
T ( 己 跟 踪 或 已 停止 )、Z( 伪 死 ) 和 U( 不 可 运行 )。bta 命令 若 不 带 任何 参数 ， 会 对 所 有 进 
程 执行 回溯 。 
除 此 之 外 ， 在 内 核 调 试 过 程 中 其 他 的 常用 KDB 命令 如 下 。 
e id 命令 : 以 地 址 /符号 作为 参数 ， 它 对 从 该 地 址 开始 的 指令 进行 反 汇 编 ， 环 境 变量 
IDCOUNT 确定 要 显示 输出 的 行 数 。 

€ ss 命令 ; 单 步 执行 指令 然后 将 控制 返回 给 KDB。ssb 是 该 指令 的 一 个 变 体 ， 它 执行 从 当 
前 指令 指针 地 址 开始 的 指令 〈 在 屏幕 上 打印 指令 )， 直 到 它 遇 到 将 引起 分 支 转移 的 指令 
为 止 。 

€ gome: 让 系统 继续 正常 执行 ， 直 到 遇 到 断 点 为 止 。 

€ reboot 命令: 立刻 重新 引导 系统 。 

e IRS: 以 地 址 、 偏 移 量 和 另 一 个 KDB 命令 作为 参数 ， 它 对 链表 中 的 每 个 元 素 反 复 执 行 

作为 参数 的 这 个 命令 。 
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例如 ， 如 下 命令 将 反 汇 编 从 schedule0 开 始 的 指令 《所 显示 的 行 数 取决 于 环境 变量 
IDCOUNT?: 
kdb» id schedule 


22.8.3 KGDB 

gdb «path»/vmlinux /proc/kcore 方式 在 调试 模块 时 缺少 一 些 至 关 重 要 的 功能 ，KDB 尽管 克 月 
了 部 分 缺陷 , 但 是 它 只 能 在 汇编 代码 级 进行 调试 ， 而 本 小 节 要 介绍 的 KGDB 则 能 很 方便 地 在 源码 
级 对 内 核 进行 调试 。KGDB 采用 的 正 是 嵌入 式 系统 中 远程 调试 的 思路 ， 主 机 和 目标 机 之 间 通 过 串 
口 或 网 口 进行 通信 。 

MontaVista Linux 直接 提供 了 对 KGDB 的 支持 ， 而 开源 社区 的 内 核 中 必须 打上 相应 版 本 的 
KGDB £M] CHI kgdb stub， 这 种 方式 俗称 “ 插 桩 ”)， 如 X86 PC 上 需要 打 的 补丁 包括 : core-lite.patch、 
i386-lite.patch、8250.patch、eth.patch、i386.patch 和 core.patch。KGDB 内 核 补丁 的 下 载 地 址 为 : 
http://kgdb.linsyssoft.com/downloads.htm 。 

打上 KGDB 补丁 后 ， 运 行 make menuconfig 时 需 选择 关于 KGDB 的 编译 项 目 ， 包 括 选择 “KGDB: 
kernel debugging with remote gdb”, ^KGDB: Console messages through gdb” 并 设置 串口 通信 方式 ， 如 
图 22.13 所 示 。 
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AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA 
lqqqqqaqqqaqaqqqaqqqaqqqqaqqqaquqqqaq Kernel hacking qqddddddddddddddddddddddddddddk 
x Arrow keys navigate the menu. «Enter» selects submenus --->. x 
x Highlighted letters are hotkeys. Pressing <Y> includes, <N> excludes, x 
x «ID modularizes features. Press <Esc><Esc> to exit, <?> for Help, </> x 
x for Search. Legend: [*] built-in [ ] excluded «IM» module < > x 
x 1 (-)dddddddddddddddddddddddddddddddddddddddddddddddddddddddddddcdddddcdk x 
X X--- Compile the kernel with frame pointers X X 
X x< > torture tests for RCU X X 
x xA : kernel debugging with remote gdb xx 
x x[*] KGDB: Console messages through gdb X X 
x X Method for KGDB communication (KGDB: On generic serial port (82x x 
x x& » KGDB: On ethernet (NEW) XX 
x x[*] Simple selection of KGDB serial port (NEW) X X 
x x(115200) Debug serial port baud rate (NE) X X 
X X(l) Serial port number for KGDB (NEW) XX 
x x[ ] Check for stack overflows XX 
x mví*) qqaaqqaaaeaaaqqeaaqqdaduqqdaaquqeeaaqqdauqeeaquqeeaaquqee«qneaquedqedqqaqdeqqeqeqqqqqj x 
tqqqdqqaqqgqqaaqqaqqqagaa n irqqqqqqqqaqqqqqqaqqqqqqqqaqqqaqqqqqqqqqqqqqqqqu 
x Select < Exit > < Help > x 
UAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAİ 











22.13 KGDB 编译 选项 配置 














在 VmWare 中 同时 启动 两 个 虚拟 机 就 可 以 模拟 KGDB 的 使 用 环境 ， 在 主机 上 运行 如 下 命令 设 
BUB CORR 

stty ispeed 115200 ospeed 115200 -F /dev/ttySO 

修改 目标 机 的 /etc/grub.conf， 增 加 如 下 项 目 : 

title Lninüx-2.6.15.5-kggb 


Boot ng 0) 
kernel /boot/vmlinuz-2.6.15.5-kgdb ro root-/dev/sdal hdc-ide-scsi kgdbwait 


kgdbwait 的 含义 是 启动 时 就 等 待 主机 的 GDB 连接 。 
依次 运行 如 下 命令 就 可 以 启动 调试 并 连接 至 目标 机 : 
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<root#> gdb ./vmlinux 
GNU gdb Red Hat Linux (6.0post-0.20040223.17rh) 
Copyright 2004 Free Software Foundation, Inc. 


oo 


GDB is free software, covered by the GNU General Public License, and you are 
welcome to change it and/or distribute copies of it under certain conditions. 
Type "show copying" to see the conditions. 

There is absolutely no warranty for GDB. Type "show warranty" for details. 
This GDB was configured as "i386-redhat-linux-gnu"...Using host libthread db library 
DA teslis l mothe eio eo. is 

(gdb) set remotebaud 115200 

(gdb) target remote /dev/ttyS0 // 连 接 目标 机 

Remote debugging using /dev/ttyS0 

breakpoint () at kernel/kgdb.c:1212 

1212 atomic set(&kgdb setting breakpoint, 0); 

warning: shared library handler failed to enable breakpoint 




































































(gdb) 
之 后 ， 在 主机 上 ， 我 们 可 以 使 用 GDB 就 像 调 试 应 用 程序 一 样 调试 加 载 了 KGDB 的 目标 机 上 
的 内 核 。 
为 进行 可 加 载 模块 的 调试 ， 需 要 使 用 gdbmod 并 借助 一 些 技巧 来 在 模块 加 载 的 时 候 获 取 symbol 























信息 。 首 先 需要 设置 solib-search-path 变量 的 路 径 ， 如 运行 “set solib-search-path /driver_study” 命 令 后 ， 
再 加 载 globalmem.ko， 接 着 运行 “info sharedlibrary” 命 令 ， 如 果 看 到 相应 的 模块 信息 ， 就 可 以 在 主机 
上 调试 加 载 后 的 globalmem.ko 模块 中 的 c 代码 了 。 

最 后 ， 需 要 注意 到 KGDB 的 工作 是 以 目标 系统 的 串口 或 网 口 正 常 工作 为 前 提 的 ， 作 为 一 种 软 
件 “ 插 桩 ”的 调试 方式 ， 在 调试 过 程 中 如 果 出 现 死机 问题 ， 主 机 上 将 无 法 定位 。 











































































































02.9 使 用 仿真 器 调试 内 术 


本 节 以 BDI2000 为 例 来 讲解 如 何 使 用 仿真 器 调试 Linux 内 核 。 BDI2000 是 一 种 最 常见 的 功能 
强大 的 仿真 器 ， 使 用 它 可 以 直接 调试 Linux 内 核 。 在 典型 的 调试 环境 中 ，BDI2000、 主 机 、 目 标 
机 这 3 者 的 关系 如 图 22.14 所 示 。 
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图 22.14 BDI2000、 主 机 与 目标 机 
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RT XERRA GDB 以 外 ，BDI2000 还 支持 商业 级 的 MontaVista DevRocket、LinuxScope 
(Eclipse GDB) 调试 器 。 

为 使 用 BDI2000 调试 目标 板 内 核 , 在 BDI2000 和 目标 板 启动 加 电 后 ,， BDI2000 端 需 完 成 如 下 
TR. 

(1) 配置 BDI2000， 修 改 .cfg 文件 ， 确 保 目标 机 的 正常 初始 化 。 

(2) 主机 通过 telnet 登录 BDI2000， 例 如 ， 若 主机 的 /etc/hosts 中 包含 了 “bdi” 节 点 ， 则 运行 
"telnet bdi” 即 可 登录 到 BDI2000。 

(3) 设 置 内 核 运行 时 的 第 一 个 断 点 ,通常 在 函数 start. kernel0, 如 “[BDI2000] bi XXXXXXXX”。 
通过 grep start kernel System.map 可 以 获得 start_kernel0 的 具体 位 置 ， 代 替 上 面 的 XXXXXXXX。 

(4) 执行 内 核 代 码 “[BDI2000] go". 

以 上 第 (3)、(4) 步 的 运行 是 以 目标 板 已 加 载 Linux 内 核 到 RAM 为 前 提 的 ， 如 果 没 有 加 载 ， 则 需 
借助 仿真 器 和 主机 端 加 载 。 

相应 地 ， 主 机 端 需 完 成 如 下 工作 。 

CD 通过 GDB 启动 内 核 调 试 ， 如 运行 : 


arm-linux-gdb vmlinux 


(2) 连接 仿真 器 ， 使 用 GDB Hj “target remote" MS: 
target remote bdi:200 


之 后 ， 就 可 以 在 GDB 中 像 调 试 应 用 程序 一 样 调 试 目 标 板 上 运行 的 Linux 内 核 了 。 


22. 10 suu 


在 嵌入 式 系统 中 ， 为 调试 Linux 应 用 程序 ， 可 在 目标 板 上 先 运行 GDBServer， 再 让 主机 上 的 
GDB 与 目标 板 上 的 GDBServer 通过 网 口 或 串口 通信 。 

1. 目标 板 

需要 运行 如 下 命令 启动 GDBSerber: 

gdbserver «host ip»:«port» «app» 

<host_ip>:<port> 为 主机 的 IP 地 址 和 端口 ，app 是 可 执行 的 应 用 程序 名 。 
当然 ， 也 可 以 用 系统 中 空闲 的 串口 作为 GDB 调试 器 和 GDBServer 的 底层 通信 手段 ， 如 : 
gdbserver/dev/ttyS0./tdemo 


2. end 
要 先 运 行 如 下 命令 启动 GDB: 
arne Anu JAD eel 
app 与 GDBServer 的 app 参数 对 应 ，arm-linux-gdb 是 专门 为 ARM 处 理 器 编译 出 的 GDB 调试 器 。 
之 后 ， 运 行 如 下 命令 就 可 以 连接 目标 板 : 
target remote <target_ip>:<port> 
<target_ip>:<port> 为 目标 机 的 IP 地 址 和 端口 。 
如 果 目 标 板 上 的 GDBServer 使 用 串口 ， 则 在 宿主 机 上 GDB 也 应 该 使 用 串口 ， 如 : 
(gdb)target remote/dev/ttyS1 


之 后 ， 便 可 以 使 用 GDB 像 调 试 本 机 上 的 程序 一 样 调试 目标 机 上 的 程序 。 
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ODO 


3. 通过 gdbserver 和 arm-linux-gdb 调试 LDD6410 应 用 程序 
我 们 为 LDD6410 开发 板 提 供 了 gdbserver, 下 面 演示 通过 以 太 网 口 调试 LDD6410 上 的 应 用 程 


序 。 要 调试 的 应 用 程序 的 源 代码 如 下 : 
/* 


* 


n 

































































gdb example.c: program to show how to use arm-linux-gdb 


void increase one(int *data) 
( *data = *data + 1; 
} 


int main(int argc, char *argv[]) 
{ ine datn =- (0 
int *p - 0; 
increase one(&dat); 
/* program will crash here */ 
increase one (p); 
rela (0g 

















译 它 : 





通过 debug 方式 编 
arm-linux-gcc -g -o gdb example gdb example.c 
将 程序 下 载 到 目标 板 后 ， 在 目标 板 上 运行 : 
gdbserver 192.168.1.20:1234 gdb example 
Process gdb example created; pid = 1096 









































Listening on port 1234 

192.168.1.20 为 目标 板 的 IP, 1234 为 gdbserver 的 侦 听 端口 。 
在 主机 上 运行 : 
lihacker@lihacker-laptop:~/1dd6410/tests/gdb-example$ arm-linux-gdb gdb example 


GNU gdb 6.6 
Copyright (C) 2006 Free Software Foundation, Inc. 






































GDB is free software, covered by the GNU General Public License, and you are welcome 
to change it and/or distribute copies of it under certain conditions. 

Type "show copying" to see the conditions. 

There is absolutely no warranty for GDB. Type "show warranty" for details. 

This GDB was configured as "--host-/usr/local/arm/4.2.2-eabi/usr/bin/ --target- arm- 
ls A) 


主机 的 arm-linux-gdb 中 运行 如 下 命令 连接 目标 板 : 
(gdb) target remote 192.168.1.20:1234 
Remote debugging using 192.168.1.20:1234 








0x400007b0 in ?? () 

运行 如 下 命令 将 断 点 设置 在 increase one(&dat);3X — 17: 
(gdb) b gdb example.c:16 

Breakpoint 1 at 0x8390: file gdb example.c, line 16. 


通过 “c” 命 令 继续 运行 目标 板 上 的 程序 ， 发 生 断 点 : 


(gdb) c 












































Continuing. 


Breakpoint 1, main (argc-1, argv-0xbead4eb4) at gdb example.c:16 
16 increase one(&dat); 
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运行 “n” 命 令 执 行 完 increase one(&dat); 



































再 查看 dat 的 值 : 

(gdb) n 

19 increase one(p); (gdb) p dat 

$1 = 1 

发 现 dat 变 成 1。 继 续 运行 “c” 命 令 ， 由 于 即将 访问 空 指针 ，gdb_example 将 衣 演 : 
taecla S 

Continuing. 


Program received signal SIGSEGV, Segmentation fault. 

0x0000834c in increase one (data=0x0) at gdb example.c:8 

8 *data - *data -* 1; 

我 们 通过 “bt” 命 令 可 以 拿 到 backtrace: 

(gdb) bt 

0 0x0000834c in increase one (data-0x0) at gdb example.c:8 
0x000083a4 in main (argc-1, argv-0xbead4eb4) at gdb example.c:19 
通过 “info reg” 命 令 可 以 查看 当时 的 寄存 器 值 : 
(gdb) info reg 
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rU 0x0 0 

r Oxbead4eb4 2199029916 
2 (Oeae dE 

aS sd 

r4 0x4001e5e0 1073866208 
x50 O O 

Ge 29999 

x (euo. 

rp- Oxo 0 

r9" xt U 


r10 0x40025000 1073893376 

rll  O0xbead4d44 3199028548 

r12  0xbead4d48 3199028552 

Sp  Oxbead4da30 0xbead4d30 

lr  0x83a4 33700 

pc  0x834c 0x834c «increase one+24> 
fps. 0x00 

cpsr 0x60000010 JL 3.015 1.277572 


PB so 性 能 监控 与 调 优 工具 


除了 保证 程序 的 正确 性 以 外 ， 项 目 开 发 中 往往 还 关心 性 能 和 稳定 性 。 这 时 候 ， 我 们 往往 要 对 
内 核 、 应 用 程序 或 整个 系统 进行 性 能 优化 。 性 能 优化 中 常用 的 手段 如 下 。 

1. 使 用 top、vmstat、iostat、sysctl 等 常用 工具 

top 命令 显示 处 理 器 的 活动 状况 。 缺 省 情况 下 ， 显 示 占 用 CPU 最 多 的 任务 ， 并 且 每 隔 5s 做 一 
次 刷新 ; iostat 命令 分 析 各 个 磁盘 的 传输 闲 忙 状况 ; vmstat 命令 报告 关于 内 核 线 程 、 虚 拟 内 存 、 
磁盘 、 陷 阱 和 CPU 活动 的 统计 信息 ; netstat 是 用 来 检测 网 络 信息 的 工具 ; sar 用 于 收集 、 报 告 或 
者 保存 系统 活动 信息 ，sar 显示 数据 、sarl 和 sar2 用 于 收集 和 保存 数据 。 

sysctl 是 一 个 可 用 于 改变 正在 运行 中 的 Linux 系统 的 接口 。 用 sysctl 可 以 读 取 设 置 超过 几 百 个 
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系统 变量 ， 例 如 “sysctl -a” 会 读 取 所 有 变量 。 

sysctl 的 实现 原理 是 : 所 有 的 内 核 参数 在 /proc/sys 形成 一 个 树 状 结构 ，sysctl 系统 调用 调用 到 
的 内 核 函 数 是 sys_sysctl， 匹 配 项 目 后 ， 最 后 的 读 写 在 do sysctl strategy 中 完成 ， 如 

echo ^*1" » /proc/sys/net/ipv4/ip forward 

就 等 价 于 : 

sysctl -w net.ipv4.ip forward -"1" 

2. 使 用 高 级 分 析 手 段 ， 如 OProfile gprof 

OProfile 可 以 帮助 用 户 识别 诸如 模块 的 占用 时 间 、 循 环 的 展开 、 高 速 缓存 的 使 用 率 低 、 低 效 
的 类 型 转换 和 和 宛 余 操作 、 错 误 预 测 转移 等 问题 。 它 收集 有 关 处 理 器 事件 的 信息 ， 其 中 包括 TLB 的 
故障 、 人 停机、 存储 器 访问 以 及 cache 命中 和 未 命中 的 指令 的 抽取 数量 。 

OProfile 支持 两 种 采样 方式 : 基于 事件 的 采样 Cevent based) 和 基于 时 间 的 采样 (time 
based)。 基 于 事件 的 采样 是 OProfile 只 记录 特定 事件 (比如 L2 cache miss). 的 发 生 次 数 ， 当 达 
到 用 户 设 定 的 定 值 时 oprofile 就 记录 一 下 ( 采 一 个 样 )。 这 种 方式 需要 CPU 内 部 有 性 能 计数 器 
(performace counter)。 基 于 时 间 的 采样 是 OProfile 借助 OS 时 钟 中 断 的 机 制 ， 每 个 时 钟 中 断 
OProfile 都 会 记录 一 次 〈 采 一 次 样 )。 引 入 的 目的 在 于 ， 提 供 对 没有 性 能 计数 器 CPU 的 支持 。 
其 精度 相对 于 基于 事件 的 采样 要 低 。 因 为 要 借助 OS 时 钟 中 断 的 支持 ， 对 禁用 中 断 的 代码 
OProfile 不 能 对 其 进行 分 析 。 

OProfile 在 Linux 上 分 两 部 分 ， 一 个 是 内 核 模 块 (oprofile.ko)， 一 个 为 用 户 空间 的 守护 进程 
(oprofiled)。 前 者 负责 访问 性 能 计数 器 或 者 注册 基于 时 间 采 样 的 函数 ， 并 采样 置 于 内 核 的 缓冲 区 内 。 
后 者 在 后 台 运 行 ， 负 责 从 内 核 空间 收集 数据 ， 写 入 文件 。 其 运行 步骤 如 下 。 

(D 初始 化 opcontrol --init 


eo 
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(2) 配置 opcontro|  --setup --event-.. 
(3) i 动 opcontrol --start 
(4) 运行 待 分 析 之 程序 xxx 
(5) 取出 数据 
opcontrol — --dump 
opcontrol --stop 





(6) 分 析 结 果 opreport -l —J/xxx 
GNU gprof 可 以 打印 出 程序 运行 中 各 个 函数 消耗 的 时 间 ， 可 以 帮助 程序 员 找 出 众多 函数 中 耗 
oM 7i. 产生 程序 运行 时 候 的 函数 调用 关系 ， 包 括 调用 次 数 ， 可 以 帮助 程序 员 分 析 程 序 的 
运行 流程 。 
GNU gprof 的 实现 原理 为 通过 在 编译 和 链接 程序 的 时 候 (使 用 -pg 编译 和 链接 选项 )，gcc 在 
多用 程序 的 每 个 函数 中 都 加 入 名 为 mcount (或 “mcount”， IÈ ^ mcount”， 依 赖 于 编译 器 或 操 
作 系 统 ) 的 函数 ， 也 就 是 说 应 用 程序 里 的 每 一 个 函数 都 会 调用 mcount， 而 mcount 会 在 内 存 中 保 
存 一 张 函数 调用 图 ， 并 通过 函数 调用 堆栈 的 形式 查找 子 函数 和 父 函 数 的 地 址 。 这 张 调用 图 也 保存 
了 所 有 与 函数 相关 的 调用 时 间 ， 调 用 次 数 等 的 所 有 信息 。 
GNU gprof 的 基本 用 法 如 下 。 
(1) 使 用 -pg 编译 和 链接 应 用 程序 。 
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(2) 执行 应 用 程序 使 之 生成 供 gprof 分 析 的 数据 。 

(3) 使 用 gprof 程序 分 析 应 用 程序 生成 的 数据 。 

3. 进行 内 核 跟踪 ， 如 LTT 

LTT (Linux Trace Toolkit) 是 一 个 用 于 跟踪 系统 详细 运行 状态 和 流程 的 工具 ， 它 可 以 跟踪 记 
录 系 统 中 的 特定 事件 。 这 些 事件 包括 : 系统 调用 的 进入 和 退出 ; 陷阱 /中 断 Crap / irq) 的 进入 和 
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退出 ; 进程 调度 事件 ， 内 核定 时 器 ;进程 管理 相关 事件 : 创建 、 唤 醒 、 信 号 处 理 等 ;文件 系统 相 
关 事 件 : open/read/write /seek / ioctl 等 ， 内 存 管理 相关 事件 : 内 存 分 配 /释放 等 ， 其 他 IPC/socket/ 
网 络 等 事件 。 而 这 些 记录 我 们 可 以 通过 图 形 的 方式 查看 ， 如 图 20.15 所 示 。 








A Trace Visualizer — /tmp/out/outt.trace 目 回 口 

































ps (398) 

dir (397) 

dir (396) 

ps (395) 

dir (384) 

ps (393) 
tracedaemon (392) 
bash (370) 
mingetty (367) 
mingetty (366) 
mingetty (365) 
mingetty (364) 
mingetty (363) 
login (362) 

Ipd (317) 

inetd (303) 
crond (289) 
atd (275) 
klogd (261) 
syslogd (250) 
apmd (127) 
kupdated (7) 
bdflush (6) 
kswapd (5) 
ksoftirqd CPUO (4) 
kapm-idled (3) 
keventd (2) 
init (1) 

Kernel (0) 








Start: 1,016,342,609,151,458 Span: 1,479 





20.15 LTT 形成 的 时 序 图 


4. 使 用 LTP 进行 压力 测试 

LTP (Linux Test Project， 官 方 网 站 http://ltp.sourceforge.net/) 是 一 个 由 SGI 发 起 并 由 IBM 
负责 维护 的 合作 计划 。 它 的 目的 是 为 开源 社区 提供 测试 套件 来 验证 Linux 的 可 靠 性 、 健 壮 性 
和 稳定 性 。 它 通过 压力 测试 来 判断 系统 的 稳定 性 和 可 靠 性 , 工程 中 我 们 可 使 用 LTP 测试 套件 
对 Linux 操作 系统 进行 超 长 时 间 的 测试 ， 它 可 进行 文件 系统 压力 测试 、 硬 盘 UO 测试 、 内 存 
管理 压力 测试 、IPC 压力 测试 、SCHED 测试 、 命 令 功 能 的 验证 测试 、 系 统 调用 功能 的 验证 测 
试 等 。 

5. 使 用 benchmark 评估 系统 系统 

可 用 于 Linux 的 benchmark 包括 Imbench、UnixBench、AIM9、Netperf、SSLperf、dbench、 
Bonnie、Bonnie++、Iozone、BYTEmark 等 ， 用 于 评估 操作 系统 、 网 络 、IO 子 系统 、CPU 等 的 性 
能 ， 参 考 网 址 http://lbs.sourceforge.net/ 列 出 了 许多 benchmark 工具 。 
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Linux 程序 的 调试 尤其 是 内 核 的 调试 看 起 来 比较 复 杀 ， 没 有 类 似 于 VC++、Tornado 的 IDE F 

















发 环境 ， 最 常用 的 调试 手段 依然 是 文本 方式 的 GDB。 文 本 方式 的 GDB 调试 器 功能 异常 强大 ， 当 
































我 们 使 用 习惯 后 ， 就 会 用 得 非常 自然 了 。 
Linux 内 核 驱 动 的 调试 方法 包括 “ 插 桩 ” 使 用 仿真 器 和 借 
多 数 情况 下 ， 原 始 的 printkO 仍 然 是 最 有 效 的 手段 。 





































































































除了 本 章 介绍 的 方法 外 ， 在 驱动 的 调试 中 很 可 能 还 会 借助 









































BJ printk(). oops. strace 等 ， 在 大 














他 的 硬件 或 软件 调试 工具 ， 如 调 




















试 USB 驱动 最 好 借助 USB 分 析 仪 ，USB 分 析 仪 将 可 捕获 USB 通信 中 的 包 , 如 同 网 络 中 的 sniffer 


软件 一 样 。 
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页 面 大 小 等 多 个 











“他 山 之 石 ， 可 以 攻 玉 ”， 
板 、 类 似 蕊 片 和 厂商 范例 程序 


速 编写 设备 如 
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的 方法 。 


23.4 528 Hh T f 
分 析 了 实时 操作 系统 VxWorks w% U 
23.5 讲解 了 如 何 将 Linux 移植 到 有 
































器 的 系统 中 
，23.1 节 从 数据 类 型 
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区 动 的 时 候 ， 驱 动 程序 所 服务 的 硬 
到 ， 因此 ， 在 纺 
























































为 了 高 效 地 推出 新 的 设备 驱 5 
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Ff Linux 2.4 和 Linux 2.6 内 核 在 设备 村 
移植 Linux 2.4 内 核 引 


他 操作 系统 


E 1| 


过 对 两 者 差异 的 分 析 ， 可 以 做 
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是 几 种 很 有 效 的 手段 ，23.2 3 
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区 动 移植 到 Linux 中 的 方法 , 主要 
区 动 和 Linux 设备 驱动 的 异同 点 。 
JTJ SoC 和 日 
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编写 可 移植 的 设备 驱动 


23.1.1 可 移植 的 数据 类 型 

C 语言 中 的 标准 数据 类 型 int、long 的 长 度 直接 与 平台 相关 ， 在 驱动 中 ， 关 键 部 分 代码 直接 使 
用 这 些 类 型 时 需要 特别 小 心 。 表 23.1 给 出 了 在 几 个 不 同 的 平台 下 char. short. int. long. ptr. long 
long 的 长 度 。 





















































































































































表 23.1 不 同 平台 下 char, short, int, long. ptr. long long 的 长 度 
arch char short int long ptr long long 
i386 2 4 4 4 8 
Alpha 2 4 8 8 8 
armv4l 2 4 4 4 8 
ia64 2 4 8 8 8 
M68K 2 4 4 4 8 
MIPS 2 4 4 4 8 
PaverPC 2 4 4 4 8 
Sparc 2 4 4 4 8 
Sparc64 2 4 4 4 8 
x86 64 2 4 8 8 8 
因此 , 在 Linux 系统 中 ， 针 对 不 同 的 体系 结构 重新 typedef 出 了 u8, u16. u32, u64, s8, s16, 
s32, s64 等 类 型 。 例 如 ， 在 i386/arm 下 这 些 类 型 的 定义 如 代码 清单 23.1 所 示 ， 而 在 ppc64 下 这 些 

































































类 型 的 定义 则 如 代码 清单 23.2 所 示 ， 可 见 影响 C 语言 基本 数据 类 型 大 小 的 主要 因素 是 CPU 字 长 。 














代码 清单 23.1 i386/arm 平台 下 u8, u16, u32, u64, s8, s16, s32, s64 的 定义 


typedef signed char s8; 
2 typedef unsigned char u8; 





typedef signed short s16; 
typedef unsigned short ul6; 


typedef signed int s32; 
typedef unsigned int u32; 


O OOS TE OI ENTER CO 


0 typedef signed long long s64; 
1 typedef unsigned long long u64; 


代码 清单 23.2 ”ppc64 平台 下 u8, u16, u32, u64, s8, s16, s32, s64 的 定义 


typedef signed char s8; 

2 typedef unsigned char u8; 
3 
4 typedef signed short s16; 
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typedef unsigned short ul6; 


typedef signed int s32; 


b 
6 
Y 
8 typedef unsigned int u32; 
9 
10 typedef signed long s64; 
it 


typedef unsigned long u64; 
Hi T u8. ul6. u32, u64, s8, s16. s32. s64 是 被 针对 不 同 的 体系 结构 单独 定义 的 ， 因 此 ， 在 
平台 下 对 其 进行 sizeof 运算 的 结果 都 是 不 变 的 ， 是 确定 长 度 的 数据 类 型 。 但 是 ， 这 些 类 型 都 应 
该 只 在 内 核 空 间 使 用 。 在 Linux 用 户 空 间 中 ， 如 果 要 使 用 确定 长 度 的 数据 类 型 ， 应 该 使 用 上 述 定义 
加 “__” 的 版 本 ， 如 __u8、__u16、__u32 等 。 鉴 于 此 ， 设 备 驱 动 中 如 果 要 向 用 户 空 间 导 出 头 文件 ， 
在 头 文件 中 也 应 该 定义 ”sxx、__uUxx 等 数据 类 型 。 
F 面 给 出 的 uxx, sxx, __ uxx, __ sxx 类 型 定义 都 是 Linux 系统 所 特有 的 ， 为 了 更 好 地 向 其 他 
平台 移植 ， 驱 动 中 最 好 使 用 int8 t. intl6 t. int32 t. uint8 t. uintl6 t. uint32 t. int64 t. uint64 t 
这 些 C99 标准 确定 长 度 类 型 。 

Linux 系统 中 定义 了 许多 以 t 为 后 绥 的 数据 类 型 ， 这 些 类 型 用 在 内 核 的 一 些 常 用 功能 的 实现 
中 ， 如 dma addr t. uid t. gid t. size t. ssize t. pid t. loff t 等 ， 这 些 类 型 的 使 用 将 使 内 核 屏 
蔽 实际 数据 类 型 间 存 在 的 差异 。 例 如 ，fie_operations 中 的 read0、write0 成 员 函 数 返回 值 为 ssize t 
类 型 ，llseek0 返 回 的 是 loff t 类 型 。 此 外 ，ssize t. pid t 这 些 类 型 也 被 赋予 了 一 些 含义 ， 这 一 点 
从 名 字 就 可 以 看 出 来 ， 如 pid t 是 进程 ID 类 型 。 


23.1.2 ”结构 体 对 界 

在 C 语言 中 使 用 结构 体 时 有 一 个 需要 特别 注意 的 事项 ， 那 就 是 结构 体 的 对 界 。struct 是 一 种 复 
合 数据 类 型 ， 其 构成 元 素 既 可 以 是 基本 数据 类 型 的 变量 ， 也 可 以 是 一 些 复 合 数据 类 型 〈 如 数据 、 结 
构 体 、 联 合体 等 ) 的 数据 单元 。 对 于 结构 体 ， 编 译 器 很 可 能 会 自动 进行 成 员 变量 的 对 齐 ， 以 提高 存 
取 效 率 。 默 认 情况 下 ， 编 译 器 为 结构 体 的 每 个 成 员 按 其 自然 对 界 Cnatural alignment) 条 件 分 配 空间 。 
个 成 员 按照 它们 被 声明 的 顺序 在 内 存 中 顺序 存储 ， 第 一 个 成 员 的 地 址 和 整个 结构 的 地 址 相同 。 
自然 对 界 指 按 结构 体 的 成 员 中 sizeof 最 大 的 成 员 对 齐 (如 果 sizeof 大 于 CPU 的 字 长 ， 仍 然 按 
照 CPU 字 长 对 齐 )， 例 如 对 于 32 位 系统 : 


esee lene ee tonne i 




















































































































































































































































































































































































































































































































































































































Char ss 
gllmoxei. 9p 





s 

在 上 述 结构 体 中 ，size 最 大 的 是 short， 其 长 度 为 两 个 字 节 ， 因 而 结构 体 中 的 char 成 员 a. c 
都 以 2 为 单位 对 齐 ，sizeofl(naturalalign) 的 结果 等 于 6。 

如 果 改 为 : 


struct naturalalign ( 


















































char- ar 
aime Sg 
char c; 























其 结果 为 12。 
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在 Linux 内 核 编程 中 ， 为 了 防止 编译 器 自动 在 结构 体 的 数据 间 插 入 空隙 ， 可 以 使 用 __attribute__ 
((packed)) 定 义 结构 体 ， 如 : 


Snel 
wd ely 
u64 lun; 
ul6 reservedl; 
































ODO 






































u32 reserved2; 
) __attribute__((packed))scsi; // 不 要 在 数据 间 插 入 空隙 


23.1.3 Little Endian 与 Big Endian 


采用 Little Endian 模式 的 CPU 对 操作 数 的 存放 方式 是 从 低 字 节 到 高 字 节 ， 而 Big Endian 模式 
对 操作 数 的 存放 方式 是 从 高 字 节 到 低 字 节 。 例 如 ，16bit 宽 的 数 0x1234 在 Little Endian 模式 CPU 
内 存 中 的 存放 方式 (假设 从 地 址 0x4000 开始 存放 ) 为 : 


内 存 地 址 0x4000 0x4001 


















































存放 内 容 0x34 0x12 














而 在 Big Endian 模式 ，CPU 内 存 中 的 存放 方式 则 为 : 





内 存 地 址 0x4000 0x4001 














存放 内 容 0x12 0x34 














32bit 宽 的 数 0x12345678 在 Little Endian 模式 CPU 内 存 中 的 存放 方式 〈 假 设 从 地 址 0x4000 
开始 存放 ) 为: 


内 存 地 址 0x4000 0x4001 0x4002 0x4003 





| 





存放 内 容 0x78 0x56 0x34 0x12 


而 在 Big Endian 模式 CPU 内 存 中 的 存放 方式 则 为 : 


内 存 地 址 0x4000 0x4001 0x4002 0x4003 








存放 内 容 0x12 0x34 0x56 0x78 














内 核 中 定义 如 下 多 个 宏 来 进行 Big Endian 模式 与 Little Endian 模式 的 互 换 ,包括 cpu to_ le64、 
le64 to cpu. cpu to le32. le32 to cpu. cpu to lel6. lel6 to cpu. 


内 核 中 定义 如 下 多 个 宏 来 进行 Big Endian 模式 与 Big Endian 模式 的 互 换 : 
cpu to be64. be64 to cpu. cpu to be32. be32 to cpu. cpu to bel6. bel6 to cpue 
在 Linux/drivers 目录 的 ATM, IEEE1394, SCSI, NET. USB 等 源码 中 ， 都 大 量 存在 对 上 述 


这 些 宏 的 使 用 。 


23.1.4 内 存 页 面 大 小 

一 般 情况 下 ， 内 存 页 面 的 大 小 是 4KB CHI PAGE SIZE 定义 为 4KB)， 但 是 这 并 非 是 一 定 的 ， 
实际 上 上， 页面 大 小 在 一 个 4—64KB 的 范围 内 是 可 变 的 ， 即 使 在 相同 的 平台 下 也 可 以 定义 不 同 的 
PAGE SIZE fll PAGE SHIFT。 
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鉴于 此 , 当 在 内 核 空间 中 通过 get_free_pagesO 函 数 申请 内 存 时 , 如 果 它 的 第 二 个 参数 为 order， 
意味 着 申请 PAGE_SIZE * 2"** 的 内 存 ， 同 样 是 申请 64KB 内 存 ， 如 果 PAGE SIZE 为 4KB， 应 该 
传 入 的 order 是 4， 如 果 了 PAGE SIZE 是 16KB， 应 该 传 入 的 参数 是 2。 为 了 保证 在 申请 64KB 内 存 
时 ， 在 任何 PAGE SIZE 的 情况 下 都 成 立 ， 可 以 使 用 如 代码 清单 23.3 所 示 的 方法 。 


代码 清单 23.3 ”通过 get_order() 获 得 要 申请 内 存 的 order 
1 #include <asm/page.h> 

2 int order = get order(64*1024); 

3 buf = get free pages (GFP KERNEL, order); 





































































































2.3. 2 巧 用 同类 设备 驱动 


23.2.1 H demo 板 驱 动 

对 于 推出 的 重要 必 片 ， 芯 片 厂商 往往 会 同时 提供 一 套 demo 板 。 这 样 的 demo 板 不 仅 在 硬件 设计 
中 被 硬件 工程 师 充 分 利用 并 进行 参考 ， 而 且 其 提供 的 驱动 程序 往往 在 新 设计 的 硬件 系统 中 被 参考 。 
借用 demo 板 驱 动 的 方法 主要 是 寻找 共性 中 的 差异 ， 例 如 共性 是 芯片 相同 ， 差 异 则 可 能 体现 
在 所 使 用 的 IO 内 存 〈 片 选 )、 中 断 和 DMA 资源 不 同 ， 在 这 种 情况 下 ， 简 单 地 修改 UO 内 存 基地 
址 、 中 断 号 以 及 DMA 通道 ，demo 板 的 驱动 就 可 以 用 在 目标 电路 板 上 。 而 如 果 除 了 芯片 相同 以 外 ， 
外 围 芯片 与 CPU 连接 所 用 的 内 存 、 中 断 和 DMA 资源 都 相同 的 话 ， 则 demo 板 驱 动 基本 上 可 以 不 
加 任何 修改 地 搬 到 目标 电路 板 上 。 
如 果 demo 板 和 目标 电路 板 所 用 资源 不 同 ， 而 demo 板 对 应 设备 被 定义 为 pltaform_ device, H. 
其 资源 并 定义 在 resource 结构 体 数 组 中 ， 则 直接 修改 resource 结构 体 即 可 ， 如 下 所 示 : 

static struct resource xxx resource[] = ( 

Ig e 
.Start = XXX MEM START, /* 修改 这 里 替换 1/0 内 存 基地 址 */ 


SET = XXX MEM START 4 XXX MEM SIZE, 
.flags - IORESOURCE MEM, 
































DS 
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[4:1] mm d 
.start = XXX INT START, /* 修改 这 里 换 中 断 */ 
.end  - XXX INT END, 
.flags = IORESOURCE IRQ, 

















同时 ， 我 们 在 编写 新 驱动 的 时 候 永 远 要 牢记 这 样 的 设计 理念 : 将 硬件 和 平台 相关 的 信息 (内 
存 地 址 、 中 断 号 、DMA 通道 、 硬 件 设置 等 ) 放 入 BSP 中 ， 作 为 platform 信息 、SPI board 信息 、 
PC board 信息 等 ， 而 不 是 直接 放 在 驱动 里 面 。 
23.2.2 ” 巧 用 类 似 芯 片 的 驱动 程序 
任何 驱动 工程 师 都 没有 必要 在 面 对 新 设备 驱动 编写 需求 的 时 候 一 切 从 头 开 始 ， 因 为 内 核 源 代 
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13 drivers 目录 (音频 设备 的 驱动 在 sound 目录 ) 中 已 经 包含 了 大 量 现成 的 类 似 艺 片 驱 动 的 源 代码 ， 是 
极 好 的 参考 模板 ， 我 们 不 需要 “re-invent the wheel”。 实 际 上 ， 在 内 核 源 代码 许多 后 期 编写 的 驱动 
程序 中 ， 就 直接 参考 了 之 前 的 驱动 源码 ， 所 以 同类 设备 的 驱动 往往 呈现 出 非常 相似 的 架构 和 数据 
结构 定义 。 我 们 来 看 看 sound/oss/ au1550 ac97.c 文件 最 开始 的 一 段 注释 : 

































































































































































$ 
* aul550 ac97.c -- Sound driver for Alchemy Au1550 MIPS Internet Edge 
ie Processor. 
* 
* Copyright 2004 Embedded Edge, LLC 
*  gdan(embeddededge.com 
* 
* Mostly copied from the aul1000.c driver and some from the 
* PowerMac dbdma driver. 
* We assume the processor can do memory coherent DMA. 
v 
这 上 段 注释 很 清楚 地 说 明 其 绝 大 多 数 代 码 都 来 自 au1000.c 驱动 ， 还 有 一 些 来 自 PowerMac dbdma 
了 驱动。 














打开 sound/oss 日 录 下 的 au1550 ac97.c (Alchemy Au1550 MIPS 处 理 器 的 音频 驱动 )、es1370.c 
(Ensoniq ES1370/Asahi Kasei AK4531 声卡 驱动 )、es1371.c Creative Ensoniq ESI371 声卡 驱动 )、 
cs46xx.c (Crystal SoundFusion CS46xx 声卡 驱动 )， 发 现 如 下 相似 之 处 。 
e 它们 全 都 自 定 义 了 全 局 的 xxx state 结构 体 实例 用 于 封装 音频 设备 的 锁 、 信 号 量 、 缓 冲 区 、 
ID 等 信息 ， 这 几 个 结构 体 分 别 是 : aul550 state. es1370 state. esl1371 state. cs state. 
e 它们 的 核心 函数 都 使 用 了 完全 相同 的 实现 方法 ，au1550 ac97.c 的 au1550_read0 和 
es1370.c 的 es1370_read0) 的 处 理 流程 是 一 致 的 ， 下 面 列表 的 左右 两 列 对 等 地 给 出 了 
aul550_read() 和 es1370_read0 函 数 的 源 代码 (为 了 进行 横向 比较 ， 适 当地 增加 了 源 代码 
的 换行 ， 以 达到 类 似 WinMerge 等 源码 比较 软件 的 效果 )。 
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Static ssize t u1550 read(struct file 
vhEWILew. eiue oe Size e CONE, 
loff t*ppos) 

( 

Struct aul1550 state *s - (struct 
aul550 state*)file-»private data; 

struct dmabuf *db = &s-»dma adc; 

DECLARE WAITQUEUE (wait, current); 

Ssize t ret; 

unsigned long flags; 

int ent; usercnt, ayvyaLly 


if (db->mapped) 
return =. ENXIO; 


if (laccess ok(VERIFY WRITE, buffer, 


count)) 
return ~ EFAULT; 
ret = 0; 





Static ssize t es1370 read(struct file 
emile, elena — VBS ounze debel e 
count Lon 1e. Jorsroxs)) 

{ 
struct es1370 state *s - (struct 

es1370 state*)file-»private data; 


DECLARE WAITQUEUE (wait, current); 
Ssize t ret = 0; 
unsigned long flags; 
unsigned swptr; 
ape Ee 


VALIDATE_STATE (s); 

if (s->dma adc.mapped) 
qst NA ILOJ 

if (laccess ok(VERIFY WRITE, buffer, 
count)) 
return - EFAULT; 
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Coume = cio ceme raeo 


down(&s-»sem); 


add wait queue(&db-»wait, &wait); 


while (count » 0) 


{ 


/* wait for samples in ADC dma buffer| 
p 
do 
{ 
Spin lock irqsave(&s-»lock, flags) ; 
if (db-»5stopped) 
start adc(s)s 
avail = db-»countz 


if (avail «- 0) 
.. Sene Current Susi 
(TASK INTERRUPTIBLE); 
spin unlock irqrestore(&s-»lock, 
flags); 


if (avail «- 0) 
( 


if (file-»f flags &O NONBLOCK) 
( 
if (!ret) 
ret = - EAGAIN; 
goto out; 
} 
up(&s-»sem); 
Schedule(); 
if (signal pending (current)) 
( 
if (!ret) 
ret = - ERESTARTSYS; 
GE 
} 


down (&s->sem); 


} 
while (avail <= 0); 


/* copy from nextOut to user 


vy 





if ((cnt - copy dmabuf user (db, 


down (&s-»sem); 


if (!s-»dma adc.ready && (ret - 


prog dmabuf adc(s))) 
GOTS Tte 


add wait queue(&s-»dma adc.wait, &wait); 


while (count » 0) 


{ 


Spin lock irqsave(&s-»lock, flags); 
Swptr = s -dma adc.swptr; 
ent — s -dma adc.dmasize — swptr; 
Aro 0s-2sdms adc.count < 6mt) 
cnt - s-»dma adc.count; 
if (cnt «- 0) 
~ en eurten -stata 
(TASK INTERRUPTIBLE); 
Spin unlock irqrestore(&s-»lock, 
ES 
(em > COUNT) 
cnt - count; 
alic. diebaue ee 09] 
( 
if (s-»dma adc.enabled) 
startades); 
if (file-»f flags &O NONBLOCK) 
( 
-EUyet) 
ret = - EAGAIN; 
goto out; 
} 
up(&s-»sem); 
schedule (); 
if (signal pending (current) ) 
{ 
if (!ret) 
ret — = ERESTARTSYS; 
GOtO Out? 
} 
down (&s-»sem); 
if (s->dma adc.mapped) 
{ 
ret = - ENXIO; 
goto out; 
} 
continue; 
} 


if (copy to user(buffer, s 
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ODO 








OND ee M C OT > ee R ewe g -»dma adc.rawbuf * swptr, cnt)) 
Cowie d») < (0) { 
{ if (!ret) 
if (!ret) ret = - EFAULT; 
ret = - EFAULT; goto out; 
goto out; } 
} swptr — (swptr F cnt) $ s 
-»dma adc.dmasize; 
Spin lock irqsave(&s-»lock, flags); Spin lock irqsave(&s-»lock, flags); 
db-»count == cnt; S-»2dma adc.swptr - swptr; 
ghoocnextoubor-centr S-»2dma adc.count -- cnt; 
if (db-»nextOut »- db-»rawbuf -* db 
-»dmasize) 
db-»nextOut -= db-»dmasize; 
Spin unlock irqrestore(&s-»lock, Spin unlock irqrestore(&s-»lock, 
flags) flaws 
count a= (GE SOUN == GNE; 
usercnt - cnt / db-»cnt factor; buffer += cnt; 
buffer += usercnt; ret t= cnt; 
ret += usercnt; if (s-»dma adc.enabled) 
Levate ae count 0) 7 start adc(s); 
] 
out: up(&s-»sem); out: up(&s-»sem); 
out2: remove wait queue(&db-»wait, remove wait queue(&s-»dma adc.wait, 
&wait); &wait); 
set current state(TASK RUNNING); set current state(TASR RUNNING); 
return ret; return ret; 
] ] 















































可 以 看 出 ， 内 核 中 看 似 神秘 的 、 庞 大 的 设备 驱动 源码 也 是 互相 学 习 、 互 相 借鉴 的 结果 。 


23.23 ”借用 必 片 厂商 的 范例 程序 
在 外 围 芯 片上 市 之 前 ， 芭 片 广 商 往往 进行 了 严格 的 验证 ， 在 他 们 的 验证 过 程 中 ， 必 然 会 编写 
代码 去 访问 和 控制 这 些 芯 片 。 很 多 时 候 ， 这 些 代码 稍 经 整理 就 被 芯片 厂商 随同 datasheet 一 起 在 网 
站 上 作为 参考 代码 发 布 。 
范例 程序 往往 停留 在 无 操作 系统 的 层次 上 ， 只 是 最 底层 的 硬件 操作 代码 ， 这 一 部 分 代码 对 驱 
动工 程 师 的 意义 如 下 。 
e 帮助 工程 师 进 一 步 理 解 芯片 与 CPU 的 接口 原理 、 芯 片 的 访问 和 控制 方法 。 
e 直接 加 以 改进 后 搬 到 Linux 设备 驱动 中 。 
Linux 设备 驱动 的 硬件 操作 方法 会 与 无 操作 系统 时 的 硬件 操作 方法 有 如 下 差异 。 
e 无 操作 系统 的 硬件 访问 方法 中 往往 没有 物理 地 址 到 虚拟 地 址 的 映射 过 程 ， 因 此 ， 在 搬 到 
Linux 系统 中 的 时 候 ， 要 注意 以 静态 映射 或 ioremap() 等 方式 映射 到 虚拟 地 址 。 
更 件 访问 中 往往 夹杂 着 延 时 ， 因 此 ， 在 无 操作 系统 的 源码 中 ， 经 常会 出 现 xxx_delayO 这 
样 的 for 循环 延迟 ， 这 些 代码 应 该 被 内 核 中 的 ndelay0 或 udelay0 蔡 换 。 如 果 延 迟 时 间 达 
到 数 十 ms， 应 该 使 用 msleep0 或 msleep_interruptible0 等 函数 。 
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e 芯片 范例 程序 只 是 对 芯片 的 操作 方法 进行 示范 ， 它 并 不 会 考虑 真实 应 用 场景 中 对 CPU 的 
资源 占用 以 及 代码 的 时 间 性 能 。 例 如 ， 如 果 在 写 寄 存 器 REGA 后 ， 要 判断 寄存 器 REGB 
的 第 0 位 为 1 后 才能 进行 下 一 次 写 ， 则 无 操作 系统 中 的 代码 呈现 为 : 

write rega(int value) 

i rega = value; 

while (!(regb &0x1)); 

上 

第 2 句 的 while (!(regb &0x1)) 是 比较 致命 的 ， 如 果 系 统 中 用 的 Linux 不 支持 抢占 调度 ， 

REGB 的 第 0 位 变 成 1 需要 相当 长 的 时 间 (如 数 十 ms)， 这 种 忙 等 待 会 导致 其 他 的 进程 全 部 得 

到 机 会 执行 。 即 使 Linux 支持 抢占 调度 ， 进 行 这 样 的 忙 等 待 也 毫 无 意义 ，Linux 中 理想 的 做 法 是 

进行 在 这 种 情况 下 调度 其 他 进程 执行 或 者 调用 cpu_relax0: 


while (my variable !- what i want) 
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cpu relax(); 

的 cpu_relaxO 的 作用 是 降低 CPU 的 消耗 ， 同 时 也 起 到 内 存 屏 障 Cmemory barrier) 的 作 
] ， 因 此 在 内 核 的 Document/volatile-considered-harmful.txt 文档 中 ， 建 议 这 种 忙 等 待 也 不 要 使 用 
volatile 关键 字 。 
使 用 while (!(regb &0x1)) 这 样 的 判断 还 有 一 个 问题 ， 如 果 硬 件 出 现 了 故障 ，REGB 的 第 0 位 
总 是 变 不 成 1 的 话 ， 在 系统 不 支持 抢占 调度 的 情况 下 ， 就 “死机 ”了 ， 所 以 在 进行 忙 等 竺 的 时 
候 ， 许 多 场合 下 会 设置 一 个 超时 机 制 。 






















































































































































































方面 发 生 了 较 大 改变 ， 随 着 公司 产品 的 过 渡 ， 了 驱动 工程 师 会 面临 着 将 驱动 从 Linux 2.4 内 核 移植 到 
Linux 2.6 内 核 ， 或 是 让 驱动 能 同时 支持 Linux 2.4 内 核 与 Linux 2.6 内 核 的 任务 。 

下 面 分 析 Linux 2.4 内 核 和 Linux 2.6 内 核 在 设备 驱动 方面 的 几 个 主要 的 不 同 点 。 

1. 内 核 模 块 的 Makefile 

Linux 2.4 内 核 中 ， 模 块 的 编译 只 需 内 核 源码 头 文件 ， 并 在 包括 linux/modules.h 头 文件 之 前 定 
X MODULE， 且 其 编译 、 连 接 后 生成 的 内 核 模块 后 绥 为 .o。 而 在 Linux 2.6 内 核 中 ， 模 块 的 编译 
要 依赖 配置 过 的 内 核 源 码 ， 编 译 过 程 首 先 会 到 内 核 源码 目录 下 ， 读 取 顶 层 的 Makefile 文件 ， 然 
返回 模块 源码 所 在 目录 ， 且 编译 、 连 接 后 生成 的 内 核 模 块 后 级 为 .ko。 
Linux 2.4 中 内 核 模 块 的 Makefile 模板 如 代码 清单 23.4 所 示 。 


代码 清单 23.4 Linux 2.4 中 内 核 模块 的 Makefile 模板 
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1 #Makefile2.4 

2 KVER-$(shell uname -r) 

3 KDIR-/lib/modules/$(KVER)/build 

4 OBJS-2mymodule.o 

5 CFLAGS--D KERNEL . -I$(KDIR)/include -DMODULE -D . KERNEL SYSCALLS _ 
6 -DEXPORT SYMTAB -02 -fomit-frame-pointer -Wall -DMODVERSIONS 
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ODO 


也 -include $(KDIR)/include/linux/modversions.h 
8 all: $(OBJS) 

9 mymodule.o: filel.o file2.o 

0 ld -r -o $0 $^ 

1l clean: 

2. Sui cst 9 


而 Linux 2.6 中 内 核 模块 的 Makefile 模板 如 代码 清单 23.5 所 示 。 



































代码 清单 23.5 Linux 2.6 中 内 核 模块 的 Makefile 模板 


# Mcakefile2.6 








2 ifneq ($ (KERNELRELEASE),) 

3 #dependency relationshsip of files and target modules 
4 #mymodule-objs := filel.o file2.o 
5 #obj-m := mymodule.o 

6 obj-m :- second.o 

7 else 

8 PWD :- $(shell pwd) 

9 KVER ?- $(shell uname -r) 

10 KDIR := /lib/modules/$(KVER) /build 
JL3E- sevtblbg 

12 $(MAKE) -C $(KDIR) M=$ (PWD) 

13 clean: 


Am mo moe ios VES S TONS, 
15 endif 


Linux 2.6 内 核 模 板 Makefile 中 的 KERNELRELEASE 是 在 内 核 源 码 的 顶层 Makefile 中 定义 的 
个 变量 ， 在 第 一 次 读 取 执行 此 Makefile 时 ，KERNELRELEASE 没有 被 定义 ， 所 以 make 将 读 取 执 

fT else 之 后 的 内 容 。 如 果 make 的 目标 是 clean， 将 直接 执行 clean 操作 ， 然 后 结束 ; 当 make 的 目 
标 为 al 时 ，-C $(KDIR) 指 明 跳 转 到 内 核 源 码 目 录 下 读 取 那里 的 Makefile，M=$(PWD) 表 明之 后 要 
返回 到 当前 目录 继续 读 入 、 执 行当 前 的 Makefile。 当 从 内 核 源码 目录 返回 时 , KERNELRELEASE 
已 被 定义 ，kbuild 也 被 启动 去 解析 kbuild 语法 的 语句 ，make 将 继续 读 取 else 之 前 的 内 容 。else 
之 前 的 内 容 为 kbuild 语法 的 语句 ， 指 明 模 块 源码 中 各 文件 的 依赖 关系 ， 以 及 要 生成 的 目标 模块 名 。 
"mymodule-objs := filel.o file2.0" 表 示 mymoudule.o 由 filel.o 与 file2.0 连接 生成 ，"obj-m := mymodule.o" 
表示 编译 连接 后 将 生成 mymodule 模块 。 

*$(MAKE) -C $(KDIR) M-$(PWD)" 5E *$(MAKE) -C $(KDIR) SUBDIRS =$(PWD)” 的 作用 
是 等 效 的 ， 后 者 是 较 老 的 使 用 方法 。 
通过 以 上 比较 可 以 看 到 ， 从 Makefile 编写 角度 来 看 ， 在 Linux 2.6 内 核 下 ， 内 核 模 块 编 译 不 
必定 义 复 杂 的 CFLAGS ， 而 且 模 块 中 各 文件 依赖 关系 的 表示 更 加 简洁 清晰 。 
在 分 析 清 楚 Linux 2.4 和 Linux 2.6 的 内 核 模 块 Makefile 的 差异 之 后 ， 可 以 给 出 同时 文 持 
Linux 2.4 内 核 和 Linux 2.6 内 核 的 内 核 模 块 Makefile 文件 ， 如 代码 清单 23.6 所 示 。 这 个 模板 中 实 
际 上 根据 内 核 版 本 ， 去 读 取 不 同 的 Makefile。 


代码 清单 23.6 ”同时 支持 Linux 2.4/2.6 的 内 核 模 块 的 Makefile 模板 
#Makefile for 2.4 & 2.6 
VERS26-$(findstring 2.6,$(shell uname -r)) 
MAKEDIR?-$ (shell pwd) 
ifeq ($(VERS26),2.6) 
include $(MAKEDIR)/Makefile2.6 
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6 else 

qi include 
8 endif 

2 





$(MAKEDIR)/Makefile2.4 


， 内 核 模 块 加 载 时 的 版 本 检查 
Linux 2.4 内 核 下 ， 执 行 “cat /proc/ksyms”， 将 会 看 到 内 核 符 号 ， 而 且 在 名 字 后 还 会 跟随 着 


T I xr 
一 串 校 验 字 符 串 ， 





























此 校 验 字符 串 与 内 核 版 本 有 关 。 在 内 核 源码 头 文件 linux/modules 目录 下 存在 
























































许多 *.ver 文件 ， 这 些 文件 起 着 为 内 核 符号 添加 校 验 后 级 的 作用 ， 如 ksyms.ver 文件 里 有 一 行 
"#define printk set ver(printk)", linux/modversions.h 文件 会 包含 所 有 的 .ver 文件 。 

所 以 当 模 块 包含 linux/modversions.h 文件 后 ， 编 译 时 ， 模 块 里 使 用 的 内 核 符号 实质 上 成 为 带 
有 校 验 后 缀 的 内 核 符号 。 在 加 载 模 块 时 ， 如 果 模 块 使 用 的 内 核 符号 的 校 验 字符 串 与 当前 运行 内 核 
所 导出 的 相应 的 内 核 符 号 的 校 验 字 符 串 不 一 致 ， 即 当前 内 核 空间 并 不 存在 模块 所 使 用 的 内 核 符 


号 ， 就 会 出 现 “Invalid module format” 的 错误 。 


































































































Linux 内 核 所 采用 的 在 内 核 符号 添加 校 验 字 符 串 来 验证 模块 的 版 本 与 内 核 的 版 本 是 否 匹 配 的 
方法 很 复杂 且 会 浪费 内 核 空 间 ， 而 且 随 着 SMP、PREEMPT 等 机 制 在 Linux 2.6 内 核 的 引入 和 完 











善 ， 模 块 运行 时 对 
校 验 码 是 否 一 致 不 能 成 为 判断 模块 可 否 被 加 载 的 充分 条 件 。 























内 核 的 依赖 不 再 仅仅 取决 于 内 核 版 本 ， 还 取决 于 内 核 的 配置 ， 此 时 内 核 符号 的 
































在 Linux 2.6 内 核 的 linux/vermagic.h 头 文件 中 定义 了 “版 本 魔术 字符 串 ” 一 一 VERMAGIC 


























STRING (如 代码 清单 23.7 所 示 )，VERMAGIC STRING 不 仅 包 含 内 核 版 本 号 ， 还 包含 内 核 编译 
所 使 用 的 GCC 版 本 、SMP 与 PREEMPT 等 配置 信息 。 在 编译 模块 时 ， 我 们 可 以 看 到 屏幕 上 会 显 
示 “MODPOST”( 模 块 后续 处 理 )， 在 内 核 源 码 目录 下 scripts/lmod/modpost.c 文件 中 可 以 看 到 模块 











































































































后 续 处 理 部 分 的 代码 。 
就 是 在 这 个 阶段 ，VERMAGIC STRING 会 被 添加 到 模块 的 modinfo 段 中 ， 模 块 编译 生成 后 ， 通 





过 “modinfo mymodule.ko” 命 令 可 以 查看 此 模块 的 vermagic 等 信息 。 










































































Linux 2.6 内 核 下 的 模块 装载 器 里 保存 有 内 核 的 版 本 信息 ， 在 装载 模块 时 ， 装 载 器 会 比较 所 保 
存 的 内 核 vermagic 与 此 模块 的 modinfo 段 里 保存 的 vermagic 信息 是 否 一 致 ， 两 者 一 致 时 ,模块 才 









































代码 清单 23.7 VERMAGIC STRING 的 定义 


FIG SMP  /* WHI SMP */ 
DULE VERMAGIC SMP "SMP " 


DULE VERMAGIC SMP "" 


FIG PREEMPT /* 配置 了 PREEMPT */ 
DULE VERMAGIC, PREEMPT "preempt " 





define MODULE VERMAGIC, PREEMPT "" 


ifdef CONFIG MODULE UNLOAD /* 支持 module HE */ 
define MODULE VERMAGIC, MODULE UNLOAD "mod unload " 


1b ifdef CON 
2 define MO 
3 else 
4 define MO 
5 endif 
6 
F ifdef CON 
8 define MO 
g else 

0 

1 #endif 

2 

3 

4 

5 #else 

6 




















define MODULE VERMAGIC MODULE UNLOAD "" 
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17 #endif 
18 
19 #ifndef MODULE ARCH VERMAGIC  /* 体系 结构 VERMAGIC */ 
20 &define MODULE ARCH VERMAGIC "" 

21 fendif 


ODO 








22 

23 /* 拼接 内 核 版 本 、 上 述 vERMAGIC 以 及 GCC 版 本 */ 
24 #define VERMAGIC STRING B 
DIEM SERIES ESO N 


26 MODULE VERMAGIC SMP MODULE VERMAGIC PREEMPT \ 
27 MODULE VERMAGIC MODULE UNLOAD MODULE ARCH VERMAGIC \ 
D Were. messa eC. a a stringify( | GNUC MINOR . ) 


在 通过 make menuconfig 对 内 核 进行 新 的 配置 后 ， 再 基于 Linux 2.6.15.5 内 核 编译 生成 的 
hello.ko 模块 〈 见 第 4 章 )， 这 个 模块 的 modinfo 结果 如 下 : 
[root@localhost driver study]4 modinfo hello.ko 























































































































filename: hello.ko 

license: Dual BSD/GPL 

author: Song Baohua 

description: A simple Hello World Module 

alias: a simplest module 

vermagic: 2.6.15.5 SMP preempt PENTIUMA gcc-3.2 

depends: 

从 中 可 以 看 出 ， 其 vermagic 为 “2.6.15.5 SMP preempt PENTIUMA gcc-3.2”， 运 行 “insmod 
hello.ko” 命 令 ， 得 到 如 下 错误 : 

insmod: error inserting 'hello.ko': -1 Invalid module format 


hello: version magic '2.6.15.5 SMP preempt PENTIUM4 gcc-3.2' should be '2.6.15.5 686 gcc-3.2' 

原因 在 于 加 载 该 hello.ko 时 候 所 使 用 的 内 核 虽 然 还 是 Linux 2.6.15.5， 但 是 和 编译 hello.ko 时 
的 内 核 的 关键 部 分 配置 不 一 样 ， 导 致 vermagic 不 一 致 ， 发 生 冲 突 ， 从 而 加 载 失败 。 

3. 内 核 模 块 的 加 载 与 卸载 函数 

在 Linux 2.6 内 核 中 ， 内 核 模块 必须 调用 宏 module init 5E module exit) 2:13] 9148 46; 5j 38 H 
函数 。 在 Linux 2.4 内 核 中 ， 如 果 加 载 函数 命名 为 init module), ERRA 73 cleanup module(); 
可 以 不 必 使 用 module init E module exit 宏 。 因 此 ， 若 使 用 module init 与 module_exit 宏 ， 代 码 
在 Linux 2.4 内 核 与 Linux 2.6 内 核 中 都 能 工作 ， 如 代码 清单 23.8 所 示 。 


代码 清单 23.8 同时 支持 Linux 2.4/2.6 的 内 核 模块 加 载 /卸载 函数 







































































LE 




































































中 
2 

3 

4 return 0; 

5 

6 

7 static void mod exit func (void) 
8 

9 Errem 

MORE 

En 


12 module init (mod init func); 


13 module exit (mod exit func); 
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4. 内 核 模 块 使 用 计数 
不 管 是 在 Linux 2.4 内 核 还 是 在 Linux 2.6 内 核 中 ， 当 内 核 模 块 正在 被 使 用 时 ， 是 不 允许 被 
氏 载 的 ， 内 核 模板 使 用 计数 用 来 反映 模块 的 使 用 情况 。Linux 2.4 内 核 中 ， 模 块 自身 会 通过 
MOD INC USE COUNT. MOD DEC USE COUNT 宏 来 管理 自己 被 使 用 的 计数 。Linux 2.6 内 
核 提 供 了 更 健壮 、 灵 活 的 模块 计数 管理 接口 try module get(&module)/£ module put (&module) 
取代 Linux 2.4 中 的 模块 使 用 计数 管理 宏 。 而 且 ，Linux 2.6 内 核 下 ， 对 于 为 具体 设备 写 驱 动 的 开 
发 人 员 而 言 ， 基 本 无 须 使 用 try module get) module put()， 设 备 驱 动 框架 结构 中 的 驱动 核 ， 
往往 已 经 承担 了 此 项 工作 。 

5. 内 核 模 块 导出 符号 
在 Linux 2.4 内 核 下 ， 默 认 情 况 下 模块 中 的 非 静 态 全 局 变量 及 函数 在 模块 加 载 后 会 输出 到 内 核 
空间 。 而 在 Linux 2.6 内 核 下 ， 默 认 情 况 时 模块 中 的 非 静 态 全 局 变量 及 函数 在 模块 加 载 后 不 会 输出 
到 内 核 空间 ， 需 要 显 式 调用 宏 EXPORT SYMBOL 才能 输出 。 所 以 在 Linux 2.6 内 核 的 模块 下 ， 
EXPORT NO SYMBOLS 宏 的 调用 没有 意义 ， 是 空 操作 。 在 同时 支持 Linux 2.4 内 核 与 Linux 2.6 
内 核 的 设备 驱动 中 ， 可 以 通过 代码 清单 23.9 来 导出 模块 的 内 核 符号 。 


代码 清单 23.9 同时 支持 Linux 2.4/2.6 内 核 的 导出 内 核 符 号 代码 段 


#include <linux/module.h> 
2 #ifndef LINUX26 

3 EXPORT NO SYMBOLS; 

4 #endif 

5 EXPORT SYMBOL (var); 

6 EXPORT SYMBOL(func); 


另外 ， 如 果 需 要 在 Linux 2.4 内 核 下 使 用 EXPORT SYMBOL， 必须 在 CFLAGS 中 定义 
EXPORT_SYMTAB， 否 则 编译 将 会 失败 。 

从 良好 的 代码 风格 角度 出 发 ， 模 块 中 不 需要 输出 到 内 核 空间 且 不 需 为 模块 中 其 他 文件 所 用 的 
全 局 变量 及 函数 最 好 显 式 申明 为 static 类 型 ， 需 要 输出 的 内 核 符号 最 好 以 模块 名 为 前 级 。 模 块 加 
载 后 ，Linux 2.4 内 核 下 可 通过 /proc/ksyms，Linux 2.6 内 核 下 可 通过 /proc/kallsyms 查看 模块 输出 
的 内 核 符号 。 

6. 内 核 模 块 输入 参数 

在 Linux 2.4 内 核 下 ， 通 过 MODULE PARM(var,type) 宏 来 向 模块 传递 命令 行 参 数 。var 为 接 
受 参 数值 的 变量 名 ，type 为 采取 如 下 格式 的 字符 串 [min[-max]]{b,h,i,l,s}。min 及 max. 用 于 表示 当 
参数 为 数组 类 型 时 ， 人 允许 输入 的 数组 元 素 的 个 数 范围 ，b 指 byte,h 指 short，i 指 int, 11H long, 
s 指 string. 
在 Linux 2.6 WI F, Zi MODULE PARM(var,type) 不 再 被 支持 ， 而 是 使 用 module param(name, 
type, perm) 和 module param array(name, type, nump, perm) 宏 。 

同样 地 ， 为 了 使 驱动 能 根据 内 核 的 版 本 分 别 调用 不 同 的 宏 导 出 内 核 符号 ， 可 以 使 用 类 似 代码 
青 单 23.10 所 示 的 方法 。 

代码 清单 23.10 ”同时 支持 Linux 2.4/2.6 的 模块 输入 参数 范例 


1 4£4include «linux/module.h» 
2 #ifdef LINUX26 
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ODO 


#include <linux/moduleparam.h> 
#endif 
ineine ro aus aT 0s 
char *string param - "I love Linux"; 


int array param[4] = 


O 0 -10 0 4 € 


0 ); 

1 #ifdef LINUX26 
2 int len = 1; 
3 endif 
4 #ifdef LINUX26 
EXE VOID DSBESE ATEM Bep aoa E 

6 MODULE PARM(string param, "s"); 

7 | MODULE PARM(array param, "1-4i"); 
8 felse 





9 module param(int param, int, 0644); 
20 module param(string param, charp, 0644); 
21 #if LINUX VERSION CODE >= 








22 KERNEL VERSION(2, 6, 10) 

IO module param array(array param, int, 

24 &len, 0644); 

25  t*else 

26 module param array(array param, int, len, 0644); 
2 dendif 

28 #endif 


7. 内 核 模 块 别名 、 加 载 接口 
Linux 2.6 内 核 在 linux/module.h 中 提供 了 MODULE ALIAS(alias) 宏 ， 模 块 可 以 通过 调用 此 安 
为 自己 定义 一 个 或 若干 个 别名 。 而 在 Linux 2.4 内 核 下 ， 用 户 只 能 在 /etc/modules.conf 中 为 模块 定 











































































































加 载 内 核 模块 的 接口 request module0 在 Linux 2.4 内 核 下 为 request module(const char * 
module name)， 在 Linux 2.6 内 核 下 则 为 request_ module(const char *fmt, ...). Œ Linux 2.6 内 核 下 ， 
驱动 开发 人 员 可 以 通过 调用 以 下 的 方法 来 加 载 内 核 模 块 。 

request module ("xxx"); 

request module ("char-major-$d-$d", MAJOR (dev), MINOR (dev)):; 


8. 结构 体 初始 化 
在 Linux 2.4 内 核 中 ， 习 惯 以 代码 清单 23.11 所 示 的 方法 来 初始 化 结构 体 ， 即 “成 员 : 值 ”的 










































































代码 清单 23.11 Linux 2.4 内 核 中 结构 体 初始 化 习惯 


Static struct file operations lp fops - 


1l 

2 

3) owner: THIS MODULE, 
4 write: lp write, 

8 akexehElLe ds xoc db 

6 open: lp open, 

ji release: lp release, 
8 














TT 

















但 是 , 在 Linux 2.6 内 核 中 ， 为 了 尽量 向 标准 C 靠拢 ， 习 惯 使 用 如 代码 清单 23.12 所 示 的 方法 
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来 初始 化 结构 体 ， 即 “成 员 = 值 ”的 方式 。 
代码 清单 23.12 Linux 2.6 内 核 中 结构 体 初始 化 习惯 


1 static struct file operations lp fops - 
à 41 

3) .owner = THIS MODULE, 

4 .write = lp write, 

5 ad QE = oot 

6 .open = lp open, 

7 .release = lp release, 

e jj 


9. 字符 设备 驱动 

在 Linux 2.6 内 核 中 ， 将 Linux 2.4 内 核 中 都 为 8 位 的 主 次 设备 号 分 别 扩展 为 12 位 和 20 位 。 
鉴于 此 ，Linux 2.4 内 核 中 的 kdev t 被 废除 ，Linux 2.6 内 核 中 新 增 的 dev. t 拓展 到 了 32 位 。 在 Linux 
2.4 内 核 中 ， 通 过 inode->i rdev 即 可 得 到 设备 号 ， 而 在 Linux 2.6 内 核 中 ， 为 了 增强 代码 的 可 移植 
性 ， 内 核 中 新 增 了 iminor0 和 imajorO 这 两 个 函数 来 从 inode 获得 设备 号 。 

在 Linux 2.6 内 核 中 ， 对 于 字符 设备 驱动 ， 提 供 了 专门 用 于 申请 /动态 分 配 设备 号 的 register 
chrdev_region() 了 水 数 和 alloc chrdev region()EA Zt, MŒ Linux 2.4 内 核 中 ， 对 设备 号 的 申请 和 注 才 
字符 设备 的 行为 都 是 在 register_chrdev0O 函 数 中 进行 的 ， 没 有 单独 的 cdev 结构 体 ， 因 此 也 不 存在 
cdev_init()、cdev_add()、cdev_del() 这 些 函 数 。 要 注意 的 是 ，register_chrdev0O) 在 Linux 2.6 内 核 中 仍 
然 被 支持 ， 但 是 不 能 访问 超过 256 的 设备 号 。 
其 次 ，devfs 设备 文件 系统 在 Linux 2.6 内 核 中 被 取消 了 ， 因 此 ， 最 新 的 驱动 中 也 不 宜 再 i 
devfs register()、devfs_unregister() 这 样 的 函数 。 

€ proc 操作 。 

以 前 的 /proc 中 只 能 给 出 字符 串 ， 而 新 增 的 seq file 操作 使 得 /proc 中 的 文件 能 导出 如 long 等 
多 种 数据 ， 为 了 支持 这 一 新 的 特性 ， 需 要 实现 seq operations 结构 体 中 的 seq_printf()、seq_putc()、 
seq_puts(0)、seq_escape()、seq_path(0)、seq_openO 等 成 员 函 数 。 

@ 内存 分 配 。 

Linux 2.4 和 Linux 2.6 在 内 存 分 配方 面 发 生 了 一 些 细微 的 变化 ， 这 些 变化 主要 包括 : 

« linux/malloc.h > K XFA Jy — linux/slab.h >; 

分 配 标志 GFP_BUFFER 被 GFP NOIO 和 GFP_NOFS 取代 ; 
3f GFP REPEAT.  GFP NOFAIL fll! GFP NORETRY 分 配 标志 ; 
页 面 分 配 函 数 alloc pages(). get free page 4 € E — linux/gfp.h F; 
对 NUMA 系统 新 增 了 alloc pages node(). free hot page(). free cold pageO RA žit; 

新 增 了 内 存 池 ; 

针对 r-cpu 变量 的 DEFINE PER. CPUO、EXPORT PER CPU SYMBOLO、EXPORT PER CPU - 
SYMBOL GPL(), DECLARE PER CPU(). DEFINE PER_CPUO 等 宏 因为 抢占 调度 的 出 现 而 变 得 不 
安全 ， 被 get_cpu var(). put cpu var()、alloc percpu()、free percpu(). per cpu ptr(). get cpu ptr(). 
put_cpu_ptrO 等 函数 替换 。 

e 内核 时 间 变 化 。 

在 Linux 2.6 中 ， 一 些 平 台 的 节拍 〈Hz) 发 生 了 变化 ， 因 此 引入 了 新 的 64 位 计数 器 jiffes 64, 
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新 的 时 间 结 构 体 timespec 增加 了 ns 成 员 变 
时 函数 ndelay()。 

e 发 /同步 。 
任务 队列 Ctask queue) 接口 函数 都 被 取消 ， 新 增 了 work queue 接口 函数 。 

e 音频 设备 驱动 。 

Linux 2.4 内 核 中 音频 设备 驱动 的 默认 框架 是 OSS, M Linux2.6 内 核 中 音频 设备 驱动 的 默认 框 
架 则 是 ALSA， 这 显示 ALSA 是 一 种 未 来 的 趋势 。 

在 内 核 的 更 新 过 程 中 ， 大 部 分 驱动 源 代码 也 随 着 内 核 中 的 API 变更 而 修改 了 ， 如 下 面 的 列表 
分 别 摘录 了 linux-2.4.18 和 linux-2.6.15.5 中 的 并 口 打印 机 字符 设备 驱动 drivers/char/Ip.c 的 源 代码 : 


ODO 


Hh 


， 新 增 了 add timer on0) 定 时 器 函数 ， 新 增 了 ns ZR SE 
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Static struct file operations lp rops =i Static struct file operations lp fops = { 
owner: THIS MODULE, .owner = THIS MODULE; 
write: lp write, .write = lp write, 
ioctl: Ic crochl, .ioctl e lp IOctl 
open: lp open, . open = lp open, 
release:lp release, .release - lp release, 
#ifdef CONFIG PARPORT 1284 #ifdef CONFIG PARPORT 1284 
read: lp read, .read = lp read, 
#endif #endif 
); ; 
MODULE PARM(parport,"1-" . MODULE module param array (parport, charp, NULL, 0); 
STRING(LP NO) "s"); module param(reset, bool, 0); 


MODULE PARM(reset, "i"); 








Static int lp release(struct inode Static int lp release(struct inode 
*inoge. struct file EE) ^imode, strüct file *ftÍile) 
( ( 
unsigned int minor - MINOR(inode unsigned int minor = iminor (inode); 
-»i rdev); 
lp claim parport or block lp claim parport or block 
(&lp table[minor]); (&lp table[minor]); 
parport negotiate (lp table[minor].dev parport negotiate (lp table[minor].dev 
-»port, IEEE1284 MODE COMPAT); -»port, IEEE1284 MODE COMPAT); 
lp table[minor].current mode - lp table[minor].current mode - 
IEEE1284 MODE COMPAT; IEEE1284 MODE COMPAT; 
lp release parport(&lp table[minor]); lp release parport(&lp table[minor]); 
lock kernel (); 
kfree(lp table[minor].lp buffer); kfree(l1p table[minor].lp buffer); 
lp table[minor].lp buffer = NULL; lp table[minor].lp buffer = NULL; 
LP F(minor)- &- -LP BUSY; LP minor) &- «LP BUSY; 


unlock kernet(); 
return 0; return 0; 
































如 果 驱 动 源 代 码 要 同时 支持 Linux 2.4 和 Linux 2.6 内 核 ， 其 实 也 非常 简单 ， 因 为 通过 
linux/version.h 中 的 LINUX VERSION CODE 可 以 获知 内 核 版 本 ， 之 后 便 可 以 针对 不 同 的 宏 定 义 
实现 不 同 的 驱动 源 代码 ， 如 代码 清单 23.13 所 示 。 
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代码 清单 23.13 ”同时 支持 Linux 2.4 和 Linux 2.6 内 核 的 驱动 编写 方法 

















1 4$include «linux/version.h» 

2 if LINUX_VERSION_CODE >= KERNEL_VERSION(2, 6, 0) 
3 #define LINUX26 

4 #endif 

5 #ifdef LINUX26 

6 /*Linux 2.6 内 核 中 的 代码 */ 

7 #else 

8  /*Linux 2.4 内 核 中 的 代码 */ 

9 #endif 











T 





T T m m 





m m 


除了 Linux 2.4 和 Linux2.6 之 间 内 核 的 变更 较 大 以 外 , Linux 2.6 的 各 个 小 版 本 向 前 推进 的 
时 候 ， 驱 动 的 架构 也 可 能 发 生 较 大 的 变动 ， 可 以 这 么 说 ， 几 乎 在 不 断 变动 中 , 这 是 Linux É 
方 内 核 演进 的 特点 。 因 此 ， 运行 于 2.6.x 的 驱动 不 一 定 能 运行 于 2.6.y， 这 些 时 候 ， 我们 要 注 
意 这 两 个 版 本 之 前 的 差异 ， 并 进行 相应 的 修改 。 
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RNAi 与 其 他 操作 系统 之 间 的 驱动 移植 


在 公司 的 项 目 更 蔡 过 程 中 ， 可 能 会 出 现 操 作 系 统 的 更 换 ， 壁 如 类 似 的 产品 中 ， 以 前 用 VxWorks 
Bk Windows CE， 现 在 想 改 用 Linux。 以 前 同类 产品 的 VxWorks/WinCE 运行 稳定 ， 且 设备 驱动 也 
被 经 过 严格 测试 ， 现 在 要 换 成 Linux 了 ， 是 不 是 VxWorks/WinCE 下 的 工作 就 完全 作废 了 呢 ? 
在 采用 原 操作 系统 的 系统 中 ， 底 层 的 硬件 操作 代码 已 经 经 过 验证 ， 这 一 部 分 可 以 被 Linux 利 
Hj: VxWorks, WindowsCE 等 操作 系统 驱动 的 架构 和 Linux 的 驱动 架构 有 一 定 的 相似 性 ， 经 过 适 
当 的 修改 ， 就 可 以 被 移植 到 Linux 中 。 

本 节 将 以 VxWorks 为 例 讲 解 Vx Works 驱动 向 Linux 驱动 的 移植 方法 。 代 码 清单 23.14 所 示 为 
VxWorks 下 的 LPT 并 口 这 一 上 典型 的 字符 设备 驱动 的 骨干 。 



























































































































































代码 清单 23.14 VxWorks 下 的 LPT 驱动 























1 LOCAL int lptOpen(LPT DEV *pDev, char neme int mode); 
2 LOCAL int lptRead(LPT DEV *pDev, char *pBuf, int size); 
Se 
4 LOCAL STATUS lptlIoctl(LPT DEV *pDev, int function, int arg); 
5 LOCAL void lptIntr(LPT DEV *pDev); 
6 LOCAL void lptInit (LPT DEV *pDev); 
7 
8 /初始 化 设备 驱动 */ 
9 STATUS lptDrv(int channels, JS LPTJHJÉ */ 

0 LPT RESOURCE *pResource /* LPT 资源 */ 

M 

2 qd 

E aeg. ee 

4 LPT DEV *pDev; 

E 

6 /* 检查 驱动 是 否 已 被 安装 */ 

7 if (lptDrvNum » 0) 

8 return (OK); 
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e 
e 

19 o 

20 if (channels » N LPT CHANNELS) 

2L return (ERROR); 

22 

23 for (ix = 0; ix « channels; ix-**, pResource--*) 

24 { 

25 pDev = &lptDev[ix]; 

26 

2 pDev-»created = FALSE; 

29 pDev-»autofeed = pResource--»autofeed; 

2 pDev-»inservice = FALSE; 

30 

3L if (pResource-»regDelta == 0) 

B2 pResource->regDelta = 1; 

33 

34 pDev->data = LPT_DATA_RES (pResource); 

313) pDev-»5stat = LPT STAT RES (pResource); 

36 pDev-»ctrl = LPT CTRL RES (pResource); 

3 pDev-»intCnt - 0; 

38 pDev-»retryCnt = pResource-»retryCnt; 

9o pDev-»busyWait = pResource-»busyWait; 

40 pDev-»5strobeWait = pResource-»strobeWait; 

41 pDev-»timeout = pResource-»5timeout; 

42 pDev-»intLevel = pResource--»intLevel; 

43 

44 /* 创建 二 进 制 信号 量 */ 

45 pDev-»syncSem = semBCreate(SEM Q FIFO, SEM EMPTY); 

46 /* 创建 互 斥 信号 量 */ 

47 pDev->muteSem = semMCreate(SEM Q PRIORITY | SEM DELETE SAFE 

48 | SEM INVERSION SAFE); 

49 /* 连接 中 断 */ 

50 (void)intConnect ((VOIDFUNCPTR*)INUM TO IVEC (pResource-»intVector), 

SE (VOIDFUNCPTR)lptIntr, (int)pDev); 

52 

53 sysIntEnablePIC (pDev->intLevel); /* 开 中 断 */ 

54 

DS lptInit(&lptDev[ix]); 

56 } 

S 

58 ER 

n lptDrvNum = iosDrvInstall(lptOpen, (FUNCPTR)NULL, lptOpen, 

60 (FUNCPTR)NULL,lptRead, lptWrite, lptlIoctl); 

61 

62 return (lptDrvNum == ERROR ? ERROR: OK); 

G3 J 

64 

65 

66 /* lptOpen - dJJf LPT */ 

67 LOCAL int lptOpen(LPT DEV *pDev, char *name, int mode) 

68 ( 

69 return ((int)pDev); 

Jg 

HL 

72 /* lptRead - 读 并 回 */ 

73 LOCAL int lptRead(LPT DEV *pDev, char *pBuf, int size) 
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74 ( 
35) return (ERROR); 
q6 1j 
IF 
78 /* lptWrite - 写 并 
79  * 返回 值 : 被 写 入 的 字 节 数 ， 或 者 ERROR 
e ww 
81 LOCAL int lptWrite(LPT DEV *pDev, char *pBuf, int size) 
9o q 
83 int byteCnt - 0; 
84 BOOL giveup = FALSE; 
85 ne 
86 int wait; 
87 
88 if (size -- 0) 
89 return (size); 
90 
91 semTake (pDev-»muteSem, WAIT FOREVER) ;//3kH He 
92 
99 retry = 0; 
94 while ((sysInByte (pDev->stat) &S MASK) != (S SELECT | S NODERR | S. NOBUSY)) 
SE ( 
96 if (retryc* » pDev-»retryCnt) 
9 { 
98 if (giveup) 
29 ( 
00 errnoSet(S ioLib DEVICE ERROR); 
01 semGive (pDev-»muteSem); 
02 return (ERROR); 
03 } 
04 else 
05 { 
06 lptInit (pDev); 
07 giveup = TRUE; 
08 } 
09 } 
0 wait = 0; 
i while (wait !- pDev-»busyWait) 
2 wait-tt; 
3 } 
4 
5 retry = 0; 
6 do 
y { 
8 wait = 0; 
9 sysOutByte (pDev->data, *pBuf); 
20 while (wait !- pDev-»strobeWait)wait-t*; 
2L sysOutByte(pDev-»ctrl, sysInByte(pDev-»ctrl) | C STROBE | C ENABLE); 
22 while (wait) 
23 Wd eon 
24 sysOutByte(pDev-»ctrl, sysInByte(pDev-»ctrl) &-C STROBE); 
25 
26 if (semTake(pDev-»syncSem, pDev-»timeout *sysClkRateGet()) == ERROR) 
21 { 
28 if (retry++ > pDev-»retryCnt) 
S20 INUX 
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ODO 


29 { 

30 errnoSet(S ioLib DEVICE ERROR); 
31 semGive (pDev-»muteSem) ;// 释 放 互 斥 
32 return (ERROR); 

33 } 

34 } 

35 else 

36 ( 

m pRut44 

38 byteCnt-*; 

99 } 


40 )while (byteCnt < size) ; 
semGive (pDev-»muteSem) ; // 释 放 互 斥 


return (size); 


/* lptloctl - 设备 特定 的 控制 */ 

LOCAL STATUS lptloctl(LPT DEV *pDev, /* 要 控制 的 设备 */ 
49 int function, /* 命令 */ 

50 int arg /* 2JJ */ 

51 ) 

52 ( 

55] int status - OK; 











DS semTake (pDev-»muteSem, WAIT FOREVER); 
56 switch (function) 


5 { 

58 case LPT SETCONTROL: 

58 sysOutByte(pDev-»ctrl, arg); 

60 break; 

61 

62 case LPT GETSTATUS: 

63 *(int*)arg = sysInByte (pDev-»stat); 
64 break; 

65 

66 default: 

677 (void)errnoSet(S ioLib UNKNOWN. REQUEST); 
68 Status = ERROR; 

69 break; 

70 } 

Tl semGive (pDev-»muteSem); 

72 

73) return (status); 

74 } 

TES) 


76 /* lptlIntr - 中 断 处 理 函 数 */ 

77 LOCAL void lptIntr(LPT_DEV *pDev) 

Je d 

79  pDev-»inservice - TRUE; 

80 pDev-»intCnt-**; 

81  semGive(pDev-»syncSem); // 释 放 同 步 信 号 量 

82 pDev->inservice = FALSE; 

83 sysOutByte(pDev-»ctrl, sysInByte(pDev-»ctrl) &-«C ENABLE); 
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84 ] 














86 /* lptInit - 初始 化 LPT 端口 */ 

87 LOCAL void lptInit(LPT DEV *pDev) 

88 ( 

89  sysOutByte(pDev-»ctrl, 0); /* init */ 

90  taskDelay(sysClkRateGet() >> 3); /* hold min 50 mili sec */ 
91 if (pDev-»autofeed) 





92 sysOutByte(pDev-»ctrl, C NOINIT | C SELECT | C AUTOFEED); 
53 else 

94 sysOutByte(pDev-»ctrl, C NOINIT | C SELECT); 

DENS 








上 述 驱 动 和 Linux 下 的 字符 设备 驱动 很 多 相似 之 处 ， 有 如 下 体现 。 

e 同样 包含 了 open()、read()、write()、ioctl0 等 函数 ， 而 且 同 样 要 注册 驱动 (使 用 
odo. 5s 

e 同样 包含 中 断 号 和 中 断 处 理 函 数 的 绑 定 过 程 ， 只 是 用 intConnect()， 而 不 是 request irq(): 

e 为 了 避免 并 发 和 竞争 或 进行 同步 ， 同 样 定 义 了 信和 号 量 和 互 斥 ， 只 是 信号 量 和 互 斥 的 名 字 
发 生 了 变化 ， 而 且 用 semBCreate()、semMCreate() 这 样 的 函数 来 创建 。 在 访问 临界 资源 
时 ， 也 一 样 用 互 斥 加 以 保护 。 

两 者 的 差异 如 下 。 

e 内核 对象、API 的 名 称 和 参数 有 很 大 不 同 ，VxWorks 5 Linux 对 等 地 位 的 函数 的 返回 1 

也 不 相同 。 表 23.2 所 示 为 VxWorks 和 Linux 在 同步 、 互 斥 和 中 断 方 面 的 对 比 。 
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表 23.2 VxWorks 和 Linux 同步 / 互 斥 /中 断 对 比 
事 项 VxWorks Linux 
临界 资源 保护 互 斥 〈 二 进 制 信号 量 ) 自 旋 锁 、 信 和 号 
没有 顶 底 半 部 的 概念 ， 但 是 中 断 服务 程序 也 通过 | isse e sm unus Tro 3m m uc 
中 断 semGive() 和 MsgQSend() 等 方式 唤醒 任务 去 完成 i [AA me HEI RT bert 
中 断 引发 的 事务 workqueue 触发 底 半 部 , 也 可 以 只 是 wake up 一 个 进程 
同步 同步 semGive()、MsgQSend() 进 行 通过 等 待 队 列 、 完 成 量 进行 























€  VxWorks 中 的 命名 习惯 和 Linux 系统 不 同 ，VxWorks 常用 “xxxYyyZzz” 命 名 方式 ， 而 
Linux 常用 “xxx_ yyy_zzz” 命 名 规则 。 

€ VxWorks 对 外 设 的 访问 中 不 会 出 现 类 似 ioremap0 这 样 的 物理 地 址 到 虚拟 地 址 的 映射 过 

fE. AE VxWorks 也 能 支持 带 MMU 的 处 理 器 , 但 是 对 系统 中 的 所 有 任务 而 言 ， 其 进行 







































































































































































的 是 完全 相同 的 物理 地 址 到 虚拟 地 址 映射 。 
因此 , 在 移植 VxWorks 驱动 到 Linux 驱动 的 过 程 中 , 可 以 借鉴 其 流程 , 但 是 必须 要 替换 APR 
函数 和 变量 命名 等 。 























除了 简单 的 字符 设备 外 ，VxWorks 下 的 TTY 设备 、MTD 设备 、 块 设备 等 驱动 的 架构 都 和 Linux 

下 的 架构 有 一 定 相 似 性 ， 但 是 ， 由 于 VxWorks 是 一 种 完全 定位 于 骨 入 式 系统 的 轻 量 级 操作 系统 ， 

因此 ， 总 体 而 言 ，VxWorks 设备 驱动 的 架构 要 比 Linux 架构 简单 。 由 于 VxWorks 中 并 不 存在 内 核 

空间 和 用 户 空间 的 界限 ， 很 多 时 候 ， 驱 动 甚至 可 以 不 遵循 架构 ， 直 接 给 应 用 程序 提供 接口 。 
接 下 来 分 析 几 个 典型 的 Vx Works 设备 驱动 的 框架 结构 。 
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1. PITRE 
VxWorks 下 弟 行 设备 驱动 的 结构 如 图 23.1 所 示 ，1/O 系统 (VxWorks 的 UO 系统 类 似 于 Linux 


oe 




































































的 VES, 都 是 向 用 户 提供 统一 的 文件 操作 接口 open()、 应 用 程序 
write(). read(). ioctl(). close) 45) 不 直接 与 串 行 设备 
驱动 打交道 ， 而 是 通过 ttyDrv 进行 。 IO 系统 























ttyDrv 是 一 个 虚拟 的 设备 驱动 ， 它 与 tylib 一 
起 ， 用 于 处 理 IO 系统 与 底层 实际 设备 之 间 的 通信 。 
它们 完成 的 工作 包括 在 驱动 表 中 添加 相应 的 驱动 条 
目 、 创 建设 备 标 识 符 ， 实 现 与 上 层 标准 WO 函数 及 
实际 驱动 程序 的 连接 ，ttyDrv 完成 open0 和 ioctl() 
两 项 功能 (对 应 函数 ttyopen0 和 ttyioct10 )，tylib 
完成 read0 和 write() 两 项 功能 (对 应 函数 tyRead() 
和 tyWrite()〉 并 管理 输入 /输出 数据 缓冲 区 。 图 23.1 VxWorks 串 行 设备 驱动 的 结构 

在 上 下 层 数据 传递 方面 ，VxWorks 使 用 如 图 23.2 所 示 的 结构 〈 假 设 串口 UART 为 8250)。 


















































Device 































































































用 户 应 用 程序 






用 户 缓冲 区 











tyRead () 


ttyDrv/tyLib 


回调 函数 : 
tyIRdO 


回调 函数 : 
tyITx Q 


i18250Starup () 
sysOutbyte () sysInbyte () 
用 户 编写 的 中 
行 设备 驱动 


23.2 VxWorks 串 行 设 备 驱动 数据 流 










































当 用 户 调用 write0) 函 数 进行 写 操作 时 ， 系 统 根据 相应 的 文件 描述 符 fd 调用 驱动 表 中 注册 的 
tyWrite0 函 数 ， 此 函数 会 将 用 户 缓冲 区 的 内 容 写 入 相应 的 输出 ring buffer。 当 发 现 缓冲 区 内 有 内 容 
时 ， 函 数 tyITx0 被 调用 ， 从 ring buffer 读 取 字符 ， 将 字符 发 往 指 定 的 串口 。 

当 串 口 接收 到 数据 时 会 调用 输入 中 断 服 务 程序 ， 将 输入 的 字符 写 入 指定 的 缓冲 区 。 然 后 由 回 
前 函数 tyIRd() 将 缓冲 区 的 内 容 读 入 ring buffer， 当 用 户 调 用 read0 函 数 进行 写 操作 时 , 会 根据 文件 
HRIST fd 调用 在 驱动 表 中 注册 的 函数 tyRead0， 此 函数 会 将 ring buffer 中 的 内 容 读 入 用 户 缓冲 区 。 

2. 块 设 备 

如 图 23.3 所 示 ， 与 Linux 类 似 ，VxWorks 中 的 块 设备 驱动 程序 也 不 与 VO 系统 直接 作用 ， 而 
是 通过 磁盘 、Flash 文件 系统 与 IO 系统 交互 。 文 件 系 统 把 自己 作为 一 个 驱动 程序 装载 到 IO 系统 
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A. 








， 并 把 请 求 转 发 给 实际 的 设备 驱动 程序 。 块 设备 的 驱动 程序 不 使 用 iosDrvinstsll0 来 安装 驱动 程 
序 ， 而 是 通过 初始 化 块 设备 描述 结构 BLK_DEV 或 顺序 设备 描述 结构 SEQ_DEV， 来 实现 驱动 程 
序 提供 给 文件 系统 的 功能 。 块 设备 也 不 调用 非 块 设备 的 安装 函数 iosDevAdd()， 而 是 调用 文件 系统 
的 设备 初始 化 函数 ， 如 dosFsDevlnitO 等 。 

3. 网 络 设备 
在 VxWorks 中 ， 网 卡 驱动 程序 分 为 END (Enhanced Network Driver， 增 强 型 网 络 驱动 ) 和 BSD 两 
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如 图 23.4 所 示 ，END JEFE 3E T MUX 模式 ， 网 络 驱动 程序 被 划分 为 协议 组 件 和 硬件 组 件 。 
MUX 是 数据 链 路 层 和 网 络 层 之 间 的 接口 ， 它 管理 网 络 协议 接口 和 底层 硬件 接口 之 间 的 交互 。 















































































































































IO 系统 Pa 办 议 协议 
de A 协议 A 协议 B 
open. [————————39 Vt | 
creat 驱动 [5] | MUX " 
应 read | 文件 系统 
NI write | 
ioctl X 
close DOS » 块 设 xxEndDrv yyEndDrv 
delete ~~ p 
RAW L—3À 5j | vw 
| us 设备 
图 23.3 VxWorks 块 设备 驱动 与 MO 系统 23.4 VxWorks 下 网 络 设备 END 驱动 









































如 图 23.5 所 示 ，MUX 数据 包 采 用 mBlk-clBlk-cluster 数据 结构 处 理 网 络 协议 栈 传输 的 数据 。 
其 中 ，cluster 保存 的 是 实际 的 数据 ，mBkk 和 
clBlk 中 保存 的 信息 用 来 管理 cluster 中 保存 的 
数据 。 

在 数据 接收 过 程 中 ， 设 备 会 直接 将 接收 到 
的 数据 包 放 入 内 存 池 预 先 分 配 的 cluster 中 并 产 
生 一 个 中 断 。 如 果 设 备 不 能 完成 上 述 功能 ， 
END 驱动 函数 应 该 完成 将 数据 从 buffer 到 
cluster 中 的 拷贝 。 数 据 被 放 到 cluster 以 后 ， 驱 
动 程序 将 通过 对 netBuflib0 中 函数 的 调用 来 完 
成 mBlk-clBlkccluster 链 的 创建 ， 从 而 为 数据 在 网 络 协议 各 层 之 间 的 传递 做 好 准备 ， 创 建 此 结构 链 



































































































































23.5 VxWorks 下 网 络 设备 驱动 的 mBlk-cIBlk-cluster £& 






















































































































































































一 般 需 要 以 下 4 步 。 
(1) 调用 函数 netClblkGet()， 从 内 存 池 中 取 cluster 结构 。 
(2) 调用 函数 netCIblkJoin0， 将 clBIK 与 存 有 数据 的 cluster 连接 起 来 。 
(3) 调用 函数 netMblkGet0， 从 内 存 池 中 取 mBIK 结构 。 
(4) 调用 函数 netMblkClJoin0， 将 mBIk 与 clBlk-cluster 结构 连接 起 来 。 
END 设备 驱动 的 数据 包 接收 过 程 的 整个 流程 如 图 23.6 所 示 ， 经 历 了 “设备 中 断 服 务 程序 一 



































调用 netjobAdd0) 添 加 网 络 任务 (类 似 于 Linux 中 的 底 半 部 ， 引 发 “ 底 半 部 ”xxReceive 被 执行 ) 一 
到 达 MUX 层 一 协议 层 一 用 户 read0 函 数 ” 的 过 程 。 
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数据 包 的 发 送 是 数据 包 接 收 的 反 过 程 ， 应 用 程序 通过 write0 函 数 调 用 将 要 发 送 的 数据 放 入 应 
用 程序 数据 缓冲 区 中 后 ， 网 络 协 议 负 责 将 bufer 中 的 数据 放 入 为 其 分 配 的 内 存 池 中 ， 并 以 
mBlk-clBlk-cluster 链 的 形式 来 存储 ， 这 样 实现 了 向 下 层 协议 传递 数据 报时 ， 传 递 的 只 是 指向 此 数 
据 链 结构 的 指针 ， 而 代 蔡 了 数据 在 各 层 协议 之 间 的 拷贝 。 
当 有 数据 要 发 送 时 ， 网 络 协议 层 通过 其 与 MUX 层 的 接口 调用 muxSend() 函 数 ， 而 muxSend() 
函数 又 调用 xxSend() 函 数 将 传递 来 的 数据 包 送 到 发 送 FIFO 队列 中 ， 然 后 起 动 网 卡 设备 的 发 送 功 
能 ， 发 送 完 后 将 随 之 产生 中 断 信 号 ， 调 用 中 断 服务 程序 ， 清 除 设备 缓冲 区 。 
与 VxWorks 相 比 ，Linux 网 络 设备 驱动 中 没有 mBlk-clBLk-cluster， 贯 穿 始 终 的 是 sk_buff， 作 
为 数据 包 的 “容器 ?”， 其 地 位 与 mBIk-clBlk-cluster 相当 。 


了 
L 一 write () 一 E buffer f 一 
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protocol 














——-- M ICM 
l 
| NET_PROTOCOL | 
| l 
| 
| | bufer d 
i recewveRtn Q RUE |  NET_FUNCS 
| 1 
| END. OBJ 1 
| Send 
| am 
seni 1 1 XXwen 
| bufer | 
l 
| netJobAdd () i 
[Tcu 三 一 一 圭一 一 一 Turm a. [oU CARY OR 
| device -> buffer | device ——- buffer o xum | 
ED EET a jean mrt al L 二 L J 
23.6 VxWorks 网 络 设备 驱动 的 数据 包 接收 流 23.7 VxWorks 网 络 设备 驱动 的 数据 包 发 送 流程 


4. PCI 设备 
在 VxWorks 中 ，PCI 设备 驱动 和 Linux 系统 类 似 ，PCI 部 分 只 是 一 个 “外 壳 ” 设备 本 身 所 属 类 
型 的 驱动 才 是 工作 的 主体 。 与 Linux 系统 类 似 ， 在 VxWorks 中 ， 初 始 化 PCI 设备 需要 如 下 几 个 步 又 。 

CD 利用 供应 商 和 设备 标识 确定 设备 的 总 线 号 、 设 备 号 和 功能 号 ， 在 系统 中 找到 设备 ， 要 用 
的 API 是 包括 pciFindDevice()、pciFindClass()， 前 者 根据 ID、 总 线 编号 、 设 备 编号 、 功 能 编号 找 
到 一 个 特定 的 PCI 设备 ， 后 者 寻找 与 参数 中 类 匹配 的 PCI 设备 。 

(2) 进行 PCI 设备 的 配置 ， 和 Linux 系统 非常 相似 ， 使 用 的 API 包括 pciConfigInByte(). 
pciConfigInWord(). pciConfigInLong(). pciConfigOutByte(). pciConfigOutWord(). pciConfigOutLong(). 
pciConfigModifyLong(). pciConfigModifyWord()fll pciConfigModifyByte()^5: 

(3) 确定 映射 到 系统 中 的 设备 的 基地 址 ， 即 分 析 PCI 设备 的 IO 内 存 /端口 资源 。 

(4) 挂 接 PCI 设备 中 断 。 

5. USB 设备 
如 图 23.8 所 示 , 与 Linux 系统 相似 ，VxWorks 中 的 USB 驱动 也 分 成 了 主机 控制 器 驱动 (HCD)、 
USB 核心 驱动 层 (OUSBDO 和 USB 设备 驱动 (Client Driver) 几 个 层次 。 

Client Driver 负责 管理 连接 到 USB 上 的 不 同 设备 ， 它 通过 IRP OO 请 求 包 ， 与 Linux 系统 中 
的 URB 类 似 ) 向 USBD 层 发 出 数据 接收 或 发 送 报 文 ， 它 向 应 用 层 提 供 API 函数 ， 屏 蔽 USB 实现 
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的 细节 ， 实 现 数据 的 透明 传输 。 

USBD 通过 IRP 得 到 此 设备 的 属性 和 本 次 数据 通信 的 要 求 ， 将 IRP 转换 成 USB 所 能 辨识 的 一 
系列 事务 处 理 ， 交 给 HCD 层 或 者 直接 交 给 HCD。 此 外 ，USBD 还 负责 新 设备 的 配置 、 被 拔 掉 设 
备 资源 的 释放 和 Client Driver HIZ E/E Z o 


ossLib usbMouseLib 等 设备 驱动 层 (Client Driver) 
usbQueue usbdLib 
usbHandleLib USB 核心 驱动 层 (USBD) 
usbListLib 
usbCoreLib 
USB 功能 函数 库 usbHedLib 


即 常用 的 USB 
例 程 函数 


















































































































主机 控制 器 驱动 程序 层 (HCD) 


usbOhciHcdLib gk usbUhciHcdLib 


硬件 层 
系统 硬件 功能 如 : PCI 控制 USB 主机 控制 器 OHCI 或 UHCI 


23.8 VxWorks 下 的 USB 驱动 层次 









































HCD 完成 对 Host 控制 器 的 管理 、 带 宽 分 配 、 链 表 管 理 及 根 Hub 功能 等 。 它 将 数据 按 传输 类 
型 组 成 不 同 的 链表 ， 并 定义 不 同类 型 传输 在 一 帧 中 所 占 带宽 的 比例 ， 交 给 Host 控制 器 处 理 ， 控 制 
器 根据 规则 从 链表 上 搞 下 数据 块 ， 为 其 创建 一 个 或 多 个 事务 ， 完 成 与 设备 的 数据 传输 。 当 事务 处 
里 完成 时 ，HCD 将 结果 交 给 USBD 层 ， 由 它 通知 对 Client Driver 进行 处 理 。 
从 以 上 分 析 可 知 ， 对 于 块 设备 、 网 络 设备 、PCI 设备 、USB 设备 等 复杂 设备 而 言 ，VxWorks 
和 Linux 驱动 的 框架 呈现 出 了 较 大 的 差异 ， 但 其 中 也 不 乏 共同 的 设计 思想 。Linux 驱动 工程 师 应 
该 在 了 解 这 些 差异 的 情况 下 ， 尽 可 能 地 利用 VxWorks 中 现成 的 稳定 的 代码 以 减少 Linux 驱动 的 工 
作 量 ， 至 少 硬 作 控制 这 一 部 分 是 可 以 通用 的 。 


Linux 内 核 的 移植 


Linux 内 核 的 移植 主要 含义 是 将 Linux 内 核 运 行 于 一 块 新 的 SoC 芯片 或 一 块 新 的 电路 板 之 上 ， 
其 实质 含义 就 是 建立 Linux 的 板 级 支持 包 (BSP)。BSP 的 本 质 作 用 有 二 : 为 内 核 的 运行 提供 底层 
支撑 ;屏蔽 与 板 相 关 的 硬件 细节 。 对 于 ARM 而 言 ，BSP 代码 位 于 arch/arm/ 的 各 个 plat 和 mach 
目录 下 ， 结 构 如 下 : 
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plat-xxx 


ODO 


linux-2.6/arch/arm/ 
plat-omap/ 
plat-pxa/ 
plat-s3c/ 
lat See 
plat-s3c64xx/ 
plat-stmp3xxx/ 

mach-xxx 

linux-2.6/arch/arm/ 
mach-s3c2400/ 
mach-s3c2410/ 
mach-s3c2412/ 
mach-s3c2440/ 
mach-s3c2442/ 
mach-s3c2443/ 
mach-s3c24a0/ 
mach-s3c6400/ 
mach-s3c6410/ 


所 有 S3C6410 板 的 板 文件 都 位 于 arch/arm/mach-s3c6410/， 如 LDD6410 的 即 为 arch/arm/ 
mach-s3c6410/mach-ldd6410.c， 而 所 有 S3C 系列 芯片 BSP 公用 的 部 分 又 被 提炼 到 arch/arm/plat-s3c/。 

这 些 代码 完成 的 主要 工作 如 下 。 

1. 时钟 tick (Hz) 的 产生 

系统 节拍 是 Linux 操作 系统 得 以 运行 的 基本 条 件 之 一 ， 为 Linux 建立 节拍 只 需要 在 硬件 上 指 
定 一 个 定时 器 ， 并 以 sys timer 的 形式 对 其 进行 封装 ， 根 据 Hz 调整 定时 器 硬件 计数 器 ， 并 在 定时 
器 中 断 的 处 理 函 数 中 调用 timer tick0。 代 码 清单 23.15 列 出 了 S3C6410 处 理 器 的 系统 定时 器 。 


代码 清单 23.15. S3C6410 处 理 器 的 系统 定时 器 


struct sys timer s3c64xx timer = { 























































































































































































































VOIE = s3c64xx timer init, 
.offset = s3c2410 gettimeoffset, 
. resume = s3c64xx timer setup 

); 


Static vold nit s3o0604xx timer init (void) 
{ 

S3c64xx timer setup(); 

setup irq(IRQ TIMERA4, &5s3c2410 timer Irog); 
} 


VO. OD d -ON CO Ga OU FS. o = 


Static irqreturn t 
S3c2410 timer interrupt(int irq, void *dev id) 
{ 

timer tick(); 

return IRQ HANDLED; 
) 


O0 n1 3 JUT- Seo. OS eh XR 





Mo 


20 static struct irqaction s3c2410 timer irq - í( 

21 .name ex UNESCO IE) "apad: Ipse sw 

22 .flags ~ IRQF DISABLED | IRQF TIMER | IRQF IRQPOLL, 
23  .handler = s3c2410 timer interrupt, 
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ZA y 

sys timer 结构 体 的 init0 成 员 函 数 用 于 定时 器 的 初始 化 (设置 硬件 计数 器 以 产生 Hz、 中 断 )。 
由 于 系统 以 Hz 为 单位 更 新 墙 上 时 间 ， 因 此 Linux 的 gettimeofday() API WRA offsetO 的 帮助 是 
无 法 达到 微 秒 级 精度 的 ，offset0 函 数 实际 是 计算 当前 硬件 计数 值 与 节拍 之 前 的 差异 。 

2. 系统 中 断 控 制 的 方法 

BSP 中 需要 将 系统 的 所 有 中 断 以 irq chip 结构 体 的 形式 进行 组 织 ， 并 实现 各 中 断 的 mask(、 












































unmake(). ack(). mask ack(0 方 法 ， 代 码 清 单 23.16 给 出 了 S3C6410 处 理 中 断 的 部 分 代码 片段 。 





代码 清单 23.16 S3C6410 BSP 中 断 处 理 





CE 
2 . name EN LET ei E Te E A SASO 
3 .mask = s3c irq uart mask, 
4 .unmask = s3c irq uart unmask, 
5 .mask ack = s3c irq uart maskack, 
6 .ack = eoe rq udrt ack, 
3 JR 
SEE 
9t 4 
ORFEO RO RESI = 0 OL y OTSR 
1 irq - uirq-»base irq -* offs; 
2 set lrg engo ee ee 
3 set irugcohip data(irug, ulrq 
4 set irq handler (irq, handle level irq); 
5 set irq flags (irq, IRQF VALID); 
$- j 
7 set irg chained handler(uirg-»parent irg, SSe irg demux uart); 
S 
€) soto me Se absabe soe uis. vale) NE ly i3. waled seule) 
20. 3 
Ai setoprfu chipolru, &sOc irg timer); 
22. 
290 for (usrt -— Ur Barb € ARRAY STZN(uart irdqs)ze gantte) 
24 B3co4xx uart irqi&uart rrgs[uart]): 
259 


3. GPIO、DMA、 时 钟 资源 的 统一 管理 
fr BSP 中， 通常 需要 将 所 有 GPIO 以 gpio chip 结构 体 的 形式 进行 组 织 ， 这 个 结构 体 ! 
函数 用 于 设置 GPIO 的 方向 、 读 取 和 设置 GPIO 的 电 平 ， 如 代码 清单 23.17 所 示 。 


代码 清单 23.17 gpio chip 结构 体 
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ql T8Etrubt gplo chip 

2 rA (*request) (struct gpio chip *chip, 

9 unsigned offset); 

4 void (*£ree) (struct gpio chip *chip, 

5 unsigned offset); 

6 int (*direction input) (struct gpio chip *chip, 
7 unsigned offset); 

8 aliat: (oeri Gramer (pono. Goio oy 

9 unsigned offset); 

10 int (*direction output) (struct gpio chip *chip, 
TI unsigned offset, int value); 
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ODO 


12 void (*set) (struct gpio chip *chip, 
1.3 unsigned offset, int value); 
14 j; 



































Linux 会 提供 如 下 一 组 通用 关于 GPIO 的 API: 


int gpio request(unsigned gpio, const char *label); 











void gpio free(unsigned gpio); 

int gpio direction input(unsigned gpio); 

int gpio direction output(unsigned gpio, int value); 
int gpio get value cansleep(unsigned gpio); 


这 样 做 的 好 处 是 驱动 的 代码 完全 可 以 以 与 平台 无 关 的 方式 申请 和 使 用 GPIO， 而 不 是 各 自 为 
政 ， 通 过 读 写 寄存 器 来 访问 GPIO， 大 大 提高 了 驱动 的 可 移植 性 
同样 的 ，BSP 也 要 实现 针对 DMA 通用 API， 如 : 


int request dma(unsigned int chan, const char * device id); 
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void free dma(unsigned int chan); 

void enable dma (unsigned int chan); 

void disable dma(unsigned int chan); 

void set dma mode (unsigned int chan, unsigned int mode); 

void set dma sg (unsigned int chan, struct scatterlist *sg, int nr sg); 


同样 的 ，BSP 也 要 实现 针对 时 钟 的 通用 API， 包 括 clk get). clk put(). clk enable0、clk disable(). 
clk get rate(). clk round rate(). clk set rate(). clk get parent(). clk set parent(). 

4. 静态 映射 的 I/O 内 存 

在 BSP 中 ， 可 以 通过 map desc 结构 体 和 iotable_init0 函 数 提前 建立 某 段 物理 地 址 和 虚拟 地 址 
之 间 的 静态 映射 ， 该 知识 点 我 们 在 第 11 E "LO 内 存 静 态 映射 ”一 节 已 经 进行 过 讲解 。 

5. 设备 的 /1O、 中 断 、DMA 等 资源 封装 平台 数据 

主要 是 platform 信息 、SPI board 信息 和 C board 信息 ， 这 些 内 容 我 们 在 前 面 各 章节 已 经 进 
行 过 讲解 ， 这 里 就 不 再 装 述 。 

最 后 ， 对 于 一 块 ARM 电路 板 而 言 ， 我 们 会 将 它 的 中 断 初 始 化 、 静 态 内 存 映 射 、 系 统 定 时 器 
等 板 级 信息 透 过 MACHINE START 和 MACHINE END 之 间 的 宏 绑 定 在 一 起 。 代 码 清单 23.18 给 
出 了 LDD6410 的 例子 。 





































































































































































































代码 清单 23.18 LDD6410 开发 板 的 MACHINE_START 和 MACHINE_END 


1 MACHINE START(SMDK6410, "LDD6410") 























2 /* Maintainer: Barry Song «21cnbao8gmail.com» */ 

3 .phys io - S3C PA UART & Oxfff00000, 

4 40 pg oftfst - (O01) S30 VA CUARTO DS» & DxIlfo. 
5 .boot params = $3C64XX PA SDRAM + 0x100, 

6 

y i eo = sS3c6410 init irq, 

8 .map io = ldd6410 map io, 

9 .init machine- l1dd6410 machine init, 

WO Ee = &s3c64xx_timer, 

11 MACHINE_END 

从 代码 清单 23.18 第 1 fT “MACHINE START(SMDK6410, "LDD6410")” 可 以 看 出 ， 


























LDD6410 仍然 使 用 了 SMDK6410 的 mach ID, 实际 上 可 以 透 过 Linux ARM 的 邮件 列表 获得 一 
个 新 的 mach ID 。 


大 多 数 工 程 师 就 职 于 设备 提供 商 ， 因 此 不 涉及 SoC 级 的 移植 ， 也 就 是 说 必 片 公司 已 经 将 系统 
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定时 器 、GPIO、DMA、 时 钟 等 都 封装 好 了 , 工程 师 只 需要 进行 板 相 关 的 移植 。 这 里 我 们 给 出 Linux 
板 级 移植 的 原则 : 切忌 直接 修改 现 有 电路 板 的 代码 作为 自身 电路 板 的 代码 ， 例 如 ， 如 果 电 
路 板 与 SMDK6410 有 差异 ， 就 直接 修改 arch/arm/mach-s3c6410/mach-smdk6410.c， 这 是 完全 错误 
的 ， 正 确 的 方法 是 新 建 自己 的 板 文件 ， 将 本 身 的 设备 和 资源 填写 在 新 的 板 文件 里 本 

除了 SoC 芯片 级 和 板 级 Linux 移植 外 ， 移 植 工作 量 最 大 的 是 体系 结构 相关 的 Linux 移植 ， 例 
如 将 Linux 移植 到 一 个 全 新 的 CPU 体系 架构 ， 如 TI 的 DSP 芯片 。 则 工作 量 还 涉及 内 存 管理 、 进 
程 调度 、 异 常 和 陷阱 等 。 


23.0 i: 


在 编写 Linux 设备 驱动 的 程序 ， 要 特别 注意 代码 的 可 移植 性 ， 要 留意 数据 类 型 的 长 度 、 结 构 
体 的 对 界 、CPU 大 小 端 模式 以 及 内 存 页 面 的 大 小 。 

为 了 加 速 驱动 的 开发 过 程 ， 在 拿 到 一 个 驱动 开发 任务 的 时 候 ， 务必 搜集 足够 的 “情报 ”， 找 到 
可 模拟 的 芯片 或 可 利用 的 代码 ， 这 样 可 以 事半功倍 。 一 般 而 言 ，demo 板 的 驱动 、 类 似 蕊 片 的 驱 双 
以 及 无 操作 系统 时 的 硬件 操作 代码 都 是 可 以 参考 的 代码 。 
Linux 2.4 到 Linux 2.6 的 改进 导致 驱动 中 发 生 了 一 些 细微 的 变化 ， 了 解 这 些 变化 后 可 进行 驱 
动 的 更 新 。 除 了 不 同 版 本 的 Linux 以 外 ， 其 他 操作 系统 中 的 驱动 源 代码 经 过 适当 的 修改 也 可 被 移 
植 到 Linux 中 。 
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